
作者簡介
蔡躍洲 劉悅欣
中國社會科學院數量經濟與技術經濟研究所
中國社會科學院大學商學院
發表于《China Economist》2022年第6期
摘要
社會各界高度關注數據要素及其流動交易,但過于聚焦個人行為數據和數據交易所模式。為更為全面地反映數據流動交易狀況,在對不同視角數據要素分類歸納的基礎上,按照數據涉及行為主體,從個人數據、企業數據、公共數據三個方面對數據流動交易模式進行系統梳理,并綜合不同來源的資料,對全球主要經濟體當下數據資源和數據市場交易規模及其趨勢特征進行了估算分析。研究結果表明:(1)豐富的現實場景決定了數據分類的多樣性,而不同類型數據的涉及主體、權屬劃分、信息密度等特征存在較大差異,由此帶來流動交易模式及收益分配的復雜性。(2)全球數據流動交易呈現產品化、服務化和平臺化趨勢特征。(3)全球主要經濟體都存在數據生成規模與數據存儲規模失衡,中國的情況尤為突出。(4)全球數據交易市場處于初期快速發展階段,成交規模數量級大致為千億美元,中國的數據要素市場發育更不充分,規模僅為全球的10%左右。社會各界應充分意識到數據要素分類和數據流動交易的多樣性、復雜性以及相關制度體系構建的艱巨性、長期性,并順應這些特點著力健全數據分級分類、加強存力算力基礎設施建設、培育數據交易開發專業機構、完善數據治理體系。
數據要素;數據分類;流動交易模式;生成存儲規模;交易成交規模
JEL分類號:D83, O25
一、引言
隨著移動互聯網、3G/4G/5G通信、云計算、人工智能等新一代信息技術的大規模商業化應用,數據的生產、收集、傳輸、處理、分析發生了全方位革命性變化,產生并積累了大量數據資源。豐富的數據資源為更多數據分析應用場景提供了基礎,催生出以平臺經濟(共享經濟)為代表的各種新業態、新模式,成為重構經濟社會生產生活組織模式的關鍵要素。2019年,黨的十九屆四中全會通過的《中共中央關于堅持和完善中國特色社會主義制度、推進國家治理體系和治理能力現代化若干重大問題的決定》提出“健全勞動、資本、土地、知識、技術、管理、數據等生產要素由市場評價貢獻、按貢獻決定報酬的機制”,明確將數據列為第七大生產要素。這表明,數字經濟時代數據在微觀生產運營、宏觀經濟增長及發展中所發揮的作用得到廣泛認可。
數字經濟時代的比特數據具有非競爭性、非排他性、低成本復制、網絡外部性、即時性等技術-經濟特征,能夠提高微觀運行效率,并在宏觀層面實現價值創造的倍增效應(蔡躍洲、馬文君,2021)。而發揮數據要素效率提升和價值倍增作用的一個重要前提在于實現其安全、有序、充分流動。為此,宏觀調控部門針對數據流動交易和要素市場建設,先后出臺多個文件予以指導。2021年12月,國務院辦公廳發布《要素市場化配置綜合改革試點總體方案》強調,完善公共數據開放共享機制、建立健全數據流通交易規則、拓展規范化數據開發利用場景、加強數據安全保護,探索建立數據要素流通規則,并提出“原始數據不出域、數據可用不可見”的交易范式和數據使用“可控可計量”原則。2022年6月22日,中央全面深化改革委員會通過《關于構建數據基礎制度更好發揮數據要素作用的意見》,明確指出要加快構建數據基礎制度體系,推進數據產權、流通交易、收益分配和安全治理,以促進數據流通使用,賦能實體經濟。2016年以來先后通過的《中華人民共和國網絡安全法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》則著重從數據安全角度對數據流動活動進行規范。
自2015年貴陽大數據交易所成立以來,地方政府紛紛著手推動數據交易所(中心)建設,作為規范數據流動交易的具體舉措。目前,包括北京、上海、深訓、廣州、福建、鄭州等地都陸續成立了數據交易所(中心)。政府推動加上媒體報道和道染,使得當下社會公眾乃至學術界的注意力更多集中在個人行為數據和數據交易所模式上,相關的學術探討和制度建設也隨之傾斜。
然而,數字經濟實踐中所產生的數據類型眾多,其流動交易模式也存在很大差別。基于消費互聯網產生的個人行為數據僅僅是全社會海量數據資源的一部分,而數據交易所撮合交易也只是數據交易的一種具體實現方式,更多交易可以由供需雙方通過點對點以數據產品/服務方式來達成。建立健全數據相關基礎制度體系,切實發揮數據作為關鍵生產要素在效率提升、價值倍增中的支撐作用,有必要在數據內涵辨析和分類基礎上,全面梳理數據流動交易模式、掌握數據資源規模結構等情況,歸納其特性趨勢。為此,本文后續各部分將從數據相關基礎概念辨析出發,系統梳理并分析不同類型數據流動交易模式,充分展示當下不同類型數據實際交易模式全貌,總結提煉特征及趨勢,以期糾正認識上偏頗乃至誤區;從存量數據資源和數據流動交易量兩方面對數據生成、存儲規模和特定數據交易方式下的成交金額進行展示及進一步估算,為考察數據資源和數據要素市場結構性特征提供更具體的量化支撐;從政策制定角度給出相應建議,以期為完善數據要素市場體制機制、促進數據流動交易共享提供基礎性的參考。
二、數據相關概念辨析與數據分類
豐裕的數據資源既是數字技術大規模商業化應用的產物,也是支撐數字經濟發展的新關鍵要素。數字經濟豐富的實踐場景使得數據呈現出多種不同分類方式。有必要在辨析“數據”內涵和外延基礎上,對數據分類進行系統性梳理,作為分析數據流動交易模式、開展數據規模估算的基礎。
(一)比特數據、數據資源與數據要素
從物理和技術角度來看,數字時代的“數據”被廣泛地界定為以二進制進行編碼、作為信息載體的字符串,即比特數據(蔡躍洲、馬文君,2021;Farboodi and Veldkamp, 2021)。比特數據的產生是基于數字技術對經濟社會現實運行狀況的觀察和記錄,因此,某種意義上可以看作是經濟活動的副產品(Veldkamp and Chung,2019)。OECD(2021)則提出“數據是通過訪問和觀察現象而產生,以數字格式記錄、組織、存儲、處理或進行訪問的信息內容”,將數據看作是一種特殊的信息表現形式,即以二進制比特形式呈現的信息。加拿大統計局(Statistics Canada,2019)出于測算的需要,將“數據”定義為已經被轉化為數字/數碼形式的觀察結果,可以存儲、傳輸或處理并從中獲取知識;該定義旨在將“數據”的范圍限定為某個時點對特定事物的觀察,并且作為數字化記錄能夠被存儲、檢索、分析和調查,從而將數字化音樂、影視資料等排除在外。事實上,“數據”歷來都被看作是一種信息(或事實),而數字時代“數據”與信息的關聯更為密切,很多語境下等同于“信息”(蔡躍洲、馬文君,2021)。
當然,以二進制字符串形式存在的比特數據與有效信息之間還存在差別,需要借助數據分析技術才能提煉出有效信息。經初次采集、以比特形式存儲的海量原始數據,在未經處理、分析、提煉其內在有效信息之前無法直接應用于生產消費場景;因此,原始數據還不是能直接參與價值創造的生產要素/數據要素,而只是具備價值創造潛力或者說潛在價值的“數據資源”(Varian,2018;UNCTAD,2021)。原始數據經過清洗、聚合、處理、分析所形成數據集、數據庫、信息報告、數據服務等不同形式的數據產品/數據服務,則可以根據現實需要應用于經濟社會運行的不同場景,如市場營銷、風險控制或是人員搜索(FTC,2014)。應用于不同場景的數據產品/數據服務,發揮了生產要素的作用,直接參與生產經營中的價值創造,是數據要素的具體呈現形式。
數據資源所具有的非競爭性、部分排他性、低成本復制等技術-經濟特征,使得數據在理論上可以被大規模重復利用,從而緩解其他有形資本稀缺性帶來的增長限制,實現宏觀倍增效應(蔡躍洲、馬文君,2021)。然而,企業生產經營實踐中,需要投入大量的人力、物力對原始數據清洗、處理、分析,才能從中提取有效信息并將其切實轉化成數據要素;這種轉化能力本身對于企業來說也是非常稀缺的(OECD,2013a)。當然,由于原始數據是有效信息的源頭,而且有的原始數據也能直接提供有效信息,因此,包括原始數據、加工數據、數據產品、數據服務在內的各種數據資源,都可以算作是廣義的數據要素。
(二)不同視角的數據分類與數據類型
數字技術的廣泛滲透性和經濟社會活動的復雜性決定了數據作為經濟社會活動的數字化記錄必然呈現出多樣性特征。為了促進數據資源/數據要素的流動交易,更好地發揮其對經濟社會運行活動的支撐作用,有必要從不同視角對數據分類進行梳理。
數據作為經濟社會活動的數字化記錄,可以從記錄對象的特征/類型入手梳理數據的分類。由于經濟社會活動的復雜性,圍繞被記錄對象分類的維度可以有很多種。比較常見的方式是根據數據生成和應用場景所屬領域進行分類,例如,比照既有的國民經濟行業分類,將數據劃分為通信大數據、金融大數據、醫療大數據、農業大數據、交通大數據、電力大數據等行業數據。也可以從經濟社會活動角度,按照數據記錄對應的每個具體環節隨其進行分類,例如,2020年工業和信息化部辦公廳引發的《工業數據分類分級指南(試行)》,將工業企業生產經營各環節進行細分,各環節對應的數據記錄則劃分為研發數據、生產數據、運維數據、管理數據和外部數據等。
更為常見的是根據數據記錄對象涉及的行為主體進行分類,具體可分為“個人行為數據”“企業生產運營數據”和“政府公共部門數據”三大類。個人行為數據主要是各種互聯網平臺上,用戶進行測覽、搜索、互動、交易等活動,被平臺實時記錄而形成的數據,如淘寶、京東的購物記錄,微信、微博等社交媒體的互動交流內容等。企業生產運營數據是企業在生產經營過程中,對各環節、各流程狀況進行記錄、監測而形成的數據,如制造企業通過傳感器實時監測反債智能化生產線運行狀況而收集沉淀的數據。政府公共部門數據則是各級政府部門、具有管理公共事務職能的組織和電力、公交、燃氣、熱力、給排水等公共服務運營單位,在提供公共基礎設施、公共服務等過程中收集、產生沉淀形成的所有數據資源,如稅務、海關等部門數據、企業經營相關資質和信用信息、自然資源數據、交通路況信息、電力供需調度數據、市政道路管網分布及運行狀態數據等等。UNCTAD(2021)類似分類則將數據區分為消費者數據、商業數據、政府及公開數據。與行為主體分類密切關聯的是數據收集、維護的資金來源以及數據權屬等問題。按照數據創建、維護和持有所需資金來源,可將其分為私人部門數據和公共部門數據;而根據所有權和使用權等法律權屬,則可劃分為公共數據和專有數據,其中專有數據特指所有權明確,受知識產權或其他類似法律效力保護的數據(Swedish National Board of Trade, 2015; Nguyen and Paczos, 2020)。
除了記錄對象外,還可以著眼于數據自身特征進行分類。從數據所提供信息含量特征來看,可以將數據劃分為原始數據、加工數據、數據產品/數據服務以及元數據。而從數據流動范圍來看,則可以分為境內流動數據和跨境流動數據。需要特別強調的是上述數據分類方式并不互斥,在不同分類標準下,同一數據(集合)可以同時歸屬于多個類型。
三、數據流動交易模式
充分流動是數據發揮其關鍵要素作用,提高運行效率、實現價值倍增效應的重要前提。數據流動的方式與數據類型密切相關。涉及的行為主體和權益歸屬不同,所包含的有效信息(及信息強度)的差異,都會影響數據流動的方式。在數字經濟運行實踐中,數據流動交易模式呈現出復雜且多樣的特征,而數據交易所僅僅是一種高社會關注度的模式。高效規范數據流動交易活動需要全面系統把握其流動模式、特征及趨勢。為此,我們將依據上述行為主體分類,對個人數據、企業數據和公共數據三類數據的流動交易模式分別進行梳理和分析。需要特別指出的是,數據流動包括數據交易,后者是非公共部門數據流動所采取的方式,而公共數據通常是通過開放共享方式實現流動。
(一)個人行為數據交易模式
個人行為數據主要是指與個人消費行為相關活動的數據記錄,即消費行為數據。對個人消費行為的記錄在互聯網出現之前已經存在,但大多散落于不同商家手中。往往需要第三方數據中介多方收集才可能形成相對完整的個人行為記錄,并由此誕生了數據產業和“數據經紀人”等概念雛形。20世紀90年代中后期,個人電腦的大范圍推廣和互聯網熱潮的興起,催生出以電子商務為代表的消費互聯網模式,個人行為數據開始被(平臺)系統性地收集,個人行為數據及其流動交易也開始進入學界研究的視野(Laudon,1996)。經過20多年的持續高速發展,眾多細分領域的消費互聯網平臺,在徹底改變了人們生活消費模式的同時,也為個人數據的收集和生成創造了良好條件,并成為個人行為數據最主要的收集者。
從行為主體/數據當事人的角度來看,互聯網平臺對個人行為數據的收集和生成大致可以分為三種情形:(1)個人主動或接受條款進行分享的那些涉及其自身及第三方的數據,如產生的社交網絡畫像、在線購物刷卡記錄等;(2)在記錄用戶活動過程中,無需用戶授權即可合法觀察和捕捉的數據,如網頁測覽數據、移動電話使用時的定位數據等;(3)基于個人數據分析推斷得到的衍生數據,個別情況下個人數據也可以從幾條看似“匿名”的數據中推斷出來。而從渠道和來源來看,消費互聯網平臺收集的個人行為數據又可以分為兩大類:一類是指在線平臺基于自己的(數字)產品和服務而直接采集的一手數據;另一類是用戶在平臺之外的活動并由其他第三方記錄收集的數據(OECD,2013)。數據當事人與數據收集者的分離使得個人行為數據的交易更為復雜,至少涉及三方主體和兩重交易。
對個人行為數據的記錄和收集可以看作是第一重交易。交易雙方分別是行為主體(平臺消費者用戶)和數據收集者(互聯網平臺),數據收集者作為買方免費或者以提供特定應用服務(免費使用App)作為對價獲得收集記錄用戶個人(消費)行為的權利,并由此沉淀積累相應的原始數據資源。由于消費行為記錄包含了消費者個人的隱私信息,這一重交易的本質也可以看作是消費者用戶以其個人隱私為代價換取互聯網平臺的免費服務;這也使得有關隱私定價的研究通常都與消費者個人行為數據聯系在一起(FTC,2014; Acquistietal.,2016)。另外,第一重(數據)交易是消費者用戶與互聯網平臺之間“數據”和“數字化服務”的互換,屬于“復合交易(composite transaction)”(Malgieri and Custers,2018)。
數據收集者/互聯網平臺與其他第三方之間的數據交易是第二重交易。在此過程中,數據收集者通常既扮演買方角色從第三方獲得額外的數據來豐富既有的個人行為數據,以實現產品創新、優化供應鏈結構和提高營銷效率,據此提升平臺對外的服務質量;也可以扮演賣方角色,向第三方提供原始數據或數據產品/數據服務,如營銷服務、信用評價等,通過更廣泛的數據流動和應用充分挖掘數據的潛在價值。而第三方既可以是其他數據平臺,也可以是數據集成商,還可能是其他具有特定數據需求的微觀經營主體或公共部門。
在第二重交易中,根據被交易數據的不同形態又分為直接交易和間接交易(田杰棠、劉露謠,2020;Bergemann and Bonatti, 2019;Veldkamp and Chung, 2019)。在直接交易模式下,售賣方(供給方)僅對原始數據進行初步加工,而不是深入挖掘潛在信息,產品主要以數據集的形式對外出售。而在間接交易模式下,售賣方對原始數據進行清洗、整理、分析挖掘后,以定制數據產品或數據服務的形式對外銷售。間接交易模式基本不涉及原始數據交換。此外,隱私計算(包括聯邦學習、安全多方計算等技術)和區塊鏈技術使得多方數據聯合分析能夠在數據不泄露的前提下進行,在技術上實現了數據可用不可見,其在多場景下的應用能提升對個人隱私信息的保護,因此成為間接交易模式的有益補充。
(二)企業數據交易共享模式
具有一定數字化基礎的企業,在日常生產經營過程中能夠產生并累積大量監測記錄數據,主要包括基于傳感器、物聯網捕捉記錄的機器設備運行狀況數據和基于企業內部IT業務系統生成的生產、銷售、物流等信息數據。同個人行為數據相比,企業數據的權屬關系相對簡單。大多數情況下,企業既是數據行為主體也是數據收集者,因此數據權屬一般不存在爭議。
從理論上講,企業數據的流動和重復使用,不僅有利于增強產業鏈上下游的協同性,帶來企業效益的提升,并在更大范圍內提高社會整體福利。但實踐中企業之間的數據交易共享并不一定會自發形成。事實上,企業出售或共享數據的意愿還要受到企業之間競爭行為的影響。只有當數據重復利用場景和數據來源企業的原始使用場景相互獨立或形成互補時,企業才有意愿共享數據。具體來說,企業作為數據收集者和所有者出售或共享其數據資源/數據產品的動機大致可分為三種:(1)直接出售數據產品或數據服務以獲得營業收入;(2)提高同關聯企業之間的協同,優化產業鏈供應鏈,開發產品、改善服務、創新商業模式;(3)實現更高效的供需匹配。另外,從數據需求角度來看,購買方獲取企業數據的主要目的包括開發新產品或改進既有產品、提高企業生產效率、改善客戶關系、優化企業內部管理結構、精確定位市場目標等(European Commissionetal., 2018)。
數字經濟實踐中,現有的企業數據交易共享模式主要有以下幾類:(1)數據企業主導的直接交易模式,即數據所屬企業直接向數據購買方出售相關數據產品或提供數據服務,并從中獲得一定收益;交易實施的具體方式通常是由數據所屬企業向購買方提供數據接口并授權訪問。(2)基于數據平臺的中介交易模式,即數據平臺將數據供給方和數據需求方聚集在一起,由其充當可信第三方中介機構對接數據供需雙方,促成交易并從每筆達成的數據交易中獲得傭金收入。從交易實踐來看,充當第三方中介的機構,既可以是諸如亞馬遜AWS這樣的綜合性云服務平臺(AWSDataExchange數據交易平臺),也可以是Dawex、大數據交易所等專業數據交易平臺,還可以是鄧白氏(Dun&Bradstreet)這樣的專業數據集成商。(3)基于產業互聯網的數據共享模式,即接入產業互聯網平臺的上下游企業,在相對安全的環境中自愿接入平臺,并在一定范圍內交換共享相關數據,以促進新產品開發或運營效率提升。接入企業通常會向產業互聯網平臺(運營方)免費開放共享數據,同時也從平臺獲得由其提供的服務或積累的其他數據。例如,空客公司于2017年建立了一家航空領域的產業互聯網平臺“Skywise(智慧天空)”,對用戶(航空公司)提供的數據進行集成并匿名化后,免費向各航空公司提供基于其匯集數據形成的全球機隊基準報告,并為航空公司和制造商提供數據接口獲取上述集成的匿名化航空數據,以助力航空公司和制造商提高運營效率、改進飛機的軟硬件設備。需要指出的是,盡管基于產業互聯網的數據共享以業務創新和效率提升為主要目標因而更多采取免費方式,但它本質上還是一種復合交易;數據企業向產業互聯網平臺免費提供數據,作為獲得平臺免費服務的對價。另外,平臺基于集成數據提供更高級數據產品和數據服務時,往往采用收費方式。
(三)公共數據流動模式
公共數據在時間、空間和樣本覆蓋范圍方面具有顯著的完備性,而其對政府公共部門和公用事業運行狀況的記錄,提供了個人、企業等微觀主體相關活動的外部環境信息,與私人部門數據形成互補,成為數據挖掘和大數據分析不可或缺的數據資源,社會各界對于獲取公共數據有著強烈的需求。實踐中,公共數據流動主要采用數據開放的方式,通常由掌握公共數據資源的政府部門或公用事業機構,在充分評估數據安全等因素前提下,有選擇地向公眾開放數據(蔡躍洲、馬文君,2021)。
從數據流動共享范圍來看,公共數據流動又可以細分為公共部門之間的數據交換和面向社會各界的數據開放。一方面,構建涵蓋不同政府部門和公共事業機構的統一數據平臺,將分散于各部門、各機構的零散數據通過跨部門數據交換予以集成,能夠形成更為統一完備的信息集,進而為政府部門迅速發現經濟社會運行中存在的問題、及時采取應對措施政策、開展動態監測和事后評估提供全面系統的一手信息。另一方面,公共部門積累的海量社會運行狀況數據,涉及實時道路交通、水文氣象、生態環境、公共安全等與生產經營活動密切相關的數據信息。如果能在安全有序前提下實現其中部分數據的共享和流動,將極大提升私人部門運營效率、促進私人部門開展創新活動。
開放政府數據歷來是各國政府加快數字化轉型的重要內容之一。早在2009年,美國一些地方政府便率先建立統一公共數據開放平臺,英國、法國、加拿大、新加坡等國家緊隨其后。2015年10月,“十三五”規劃建議中明確提出實施“國家大數據戰略”后,中國也自上而下著手推進公共數據平臺建設和數據開放相關工作。在開放級別上,根據涉及內容的敏感性和安全性可以將公共數據劃分為三類:無條件共享數據、受限共享數據和不共享數據。無條件開放的公共數據,通常可以從統一的公
共數據開放通道(如公共信息門戶平臺)中獲取,而受限開放公共數據的獲取則需要向數據主管部門提出申請,經審核并簽訂協議和安全承諾。
公共數據對社會各界的開放原則上講是免費的。不過,考慮到數據的收集、存儲、加工整理,需要由數據科學專業技術人員完成,涉及大量人力和財力投入,僅靠政府部門或公共事業機構自身難以完成。為此,在國內外實踐中,公共部門往往會引入商業機構參與公共數據的加工整理,涉及的部分數據服務也會采用收費方式。例如,英國將公共部門信息的持有者(PublicSectorInformationHolders,PSIHs)劃分為三類:(1)免費提供未經信息精煉的PSI機構;(2)使用PSI數據改進或支持內部活動的機構;(3)具有商業激勵的PSI創收機構。其中,第(3)類機構在對第三方提供基于原始公共數據形成的數據產品或數據服務時往往會采取收費模式。
目前,中國各地公共部門也在積極探索公共數據授權運營方式,以充分挖掘公共數據的潛在價值。如《上海市數據條例》提出,促進公共數據社會化開發利用。《浙江省公共數據條例》提出,縣級以上人民政府可以授權符合相關規定的法人組織或非法人組織運營公共數據,授權運營單位應當依托公共數據平臺對授權運營的公共數據進行加工,對加工形成的數據產品和服務,可以向用戶提供并獲取合理收益。上述授權運營在性質上類似于公共服務的特許經營,其收費標準應以彌補公共服務提供必要成本為限(常江和張震,2022)。
(四)數據流動交易模式特點
從前述個人數據、企業數據和公共數據三類不同行為主體數據的流動交易模式梳理可以看出,各類模式都是基于數據流動交易現實需要而自發形成的,總體呈現以下特點。
一是流動交易模式多樣化,涉及主體關系復雜化。現實中數據需求和應用場景千差萬別,而不同類型數據的記錄對象、涉及主體和權屬關系也各不相同;這些因素相互交織,使得數據流動交易的實現方式和供需雙方及第三方的對價支付、收益分配呈現出紛繁復雜的局面。另外,數據流動交易不可避免會衍生出個人隱私和信息安全等問題,如何確定交易共享的范圍、程度,需要在效率和安全之間不斷權衡。
二是交易(流動)對象/標的呈產品化、服務化趨勢。從流動交易客體來看,盡管以原始數據為標的的直接銷售模式和以數據產品/數據服務為標的的間接銷售形式都占據一定比例,但后者有望成為未來數據交易市場的主要形式。畢竟基于買方需求提供經過加工的數據產品/數據服務,不會涉及原始數據復制轉移,從而規避了由此帶來的權屬糾紛,同時也有利于保護個人隱私安全和國家信息安全。
三是平臺或中介在數據流動交易中越來越發揮主導作用。盡管也有數據供需雙方點對點直接交易的情形,但越來越多的數據流動特別是數據交易都是基于平臺多邊市場,由數據中介主導完成的。數據中介既可以是平臺企業,也可以是數據集成商,或者數據經紀人:(1)一種情況下,數據經紀人通常只是撮合交易,買賣雙方交易成功后從成交額中提取一定比例傭金;這種模式可替代性較高,數據中介/經紀人的作用有限,現實中交易雙方甚至可以避開數據經紀人達成協議。(2)數據集成商不僅對外提供數據(產品/服務),自身也是數據的需求方。例如在消費金融領域,通常是銀行和金融機構收集消費者數據(如個人賬戶信用歷史等),這些公司將數據提供給征信機構的同時,也向征信機構購買關于自身客戶和潛在新客戶的額外信息(BergemannandBonatti,2019)。數據集成商由于自身業務的特性匯集了大量數據,在數據質量、內容或范圍或是核心算法技術等方面具有一定的競爭優勢,一般很難被取代。(3)作為數據中介的平臺企業,不僅僅提供撮合交易平臺,同時在自身平臺上提供數據交易所需的其他增值服務,例如,AWS數據交易平臺和上海大數據交易平臺,都可以提供數據交易的一站式服務,并充分保障數據安全。
四、數據資源及其流動交易規模估算
數據要素分類和流動交易模式的復雜多樣性決定了數據要素涵蓋范圍可以有多種不同口徑。客觀認識數據資源和數據要素市場運行的特征規律需要科學準確估算數據要素規模,這就必須界定清楚估算對象所對應的口徑標準。根據前述數據要素內涵分類和流動交易模式的梳理,估算數據要素規模,既可以圍繞數據要素(資源)的規模進行,也可以針對數據流動交易的規模進行。前者從生產和存儲角度反映數據要素規模,而后者則可以從流量角度間接反映數據要素使用的情況。由于數據類型和流動交易模式都較為繁雜,而現行國民經濟統計體系也無法提供直接對應的數據,為此本部分將從生產存儲和流動交易兩個方面,綜合多渠道數據信息,嘗試對數據要素不同口徑的規模進行估算,據此對數據要素規模呈現的結構性特征進行分析歸納。
(一)數據資源規模估算
伴隨新一代信息技術的大規模商業化應用,數據生產(收集)成本大幅降低,邊際成本接近于零,數據資源則呈爆炸式增長。根據IDC等機構的估算,2000年,全球生成數據總量約為1000~2000PB;到2010年生成數據總量已達2ZB,增加1千倍以上。與此相對應,每年存儲下來的數據也同樣持續高速攀升,但其增速與生成數據增速之間卻存在較大差距。根據IDC與希捷共同發布的研究報告《數字化世界——從邊緣到核心》,2020年全球數據存儲介質的出貨容量大約為2ZB,而同年全球新產生的數據總量達到64ZB。這意味著,2020年全球實際被存儲下來的數據大約僅占當年新生成數據總量的3.4%(見表1)。
![]()
雖然我們并不能確切統計每年新增的存儲數據規模,但可以通過全球存儲介質出貨容量予以間接住證IDC的上述判斷。當前,數據主要是存儲于機械硬盤和固態硬盤兩類介質。近年來,在數據產量爆發式增長趨勢下,固態硬盤在存取速度等技術層面展現出顯著優勢,其市場規模和存儲容量也穩步攀升。然而,從技術升級選代到實現最終替換本身需要較長時間,而且機械硬盤在價格和容量方面還具備絕對優勢;因此,機械硬盤年出貨容量占據全球數據存儲出貨容量比重仍保持在60%以上(Reinseletal.,2017)。全球機械硬盤的生產供給主要集中于希捷、西部數據和東芝三家廠商。根據調研機構Trendfocus統計,2020年上述三家廠商機械硬盤出貨容量分別達到479.99EB、422.23EB和116.1EB。據此,利用企業財務報告數據和前述60%比例結構,可以大致估算全球新增存儲介質容量,并間接反映數據資源每年新增存量規模。相關估算數據與IDC報告數據從趨勢到規模都較為接近,二者可以相互形成印證。
需要特別指出的是,每年新增存儲介質容量與當年新存儲數據之間并不會完全重合。一方面,當年新增存儲介質的利用率不可能達到100%;另一方面,每年存量數據中會有一定比例被刪除,由此騰出的存儲空間也會被用于新增數據的存儲。因此,每年生成數據被存儲的比例與表2中第四列比例相比會有一定出入。考慮到存儲介質購置和維護都是有成本的,存儲介質購置規模(出貨量)加上少量既有數據刪除所形成的新增存儲空間,相對于每年的實際新增存儲數據不會有過多冗余。假定冗余比例、刪除比例相對穩定,數據存儲介質出貨容量規模基本可以反映出新增存儲數據規模。
2022年,華為公司聯合羅蘭貝格發布的《數據存力,高質量發展的數字基石》報告,提出了“數據存力”概念,并將“區域內數據存儲設備容量與當年生成數據總量之比”作為衡量數據存力充足性的指標。報告對全球各國數據存力充足性進行測算,結果顯示:美國數據存力充足性指數高達19.4%,排名全球第一;而中國數據存力充足性指數為8.9%,遠低于美國,位列第11位。中美兩國同為數據生產大國,每年新生成數據量穩居世界前2位,數據存力充足性的差距主要源于中國以往在存儲方面投資的不足。近年來,各方也在加大存儲領域投資力度以彌補前期投資不足;2017~2019年中國存儲領域投資年均增長率高達45.4%(見表2)。
![]()
另外,根據《數字中國發展報告(2021年)》,2017~2021年,中國每年新生成數據從2.3ZB增長至6.6ZB,平均年增長率30.2%。含結合華為報告給出的數據存力充足性指數,2020年中國存量的數據存儲設備容量大約為0.59ZB;再考慮一定的冗余量,當年累計存儲下來的數據資源應該在0.5ZB左右。而中國信息通信研究院(2022)最新公布的估算數據顯示,2021年中國存儲總量容量達到800EB,此外,《國家數據資源調查報告(2020)》指出,2019年底中國數據總存量為332EB,a這兩項數據在量級上正好驗證了上述推算結果。如果新增存儲數據占比以40%計算,例那么2020年新增數據存儲量大約在0.2ZB左右,在5.1ZB新生成數據規模中的比重大約為3.9%。該比重與表1中基于數據存儲介質出貨容量計算出的全球比重大致相當,形成相互印證。
(二)數據流動交易規模估算
從前述第二部分可知,數據交易流動模式繁雜多樣,不同模式對應著不同的統計口徑,很難就各種模式對應流動交易數據規模一一進行估算。然而,除了公共數據共享外,大多數的數據流動都是通過交易方式實現的,其中很大一部分交易會以貨幣形式支付對價。每年數據交易的成交金額也不失為反映數據流動交易規模的一種方式。
現有的行業統計資料將大數據市場定義為廣義的數據產業市場,涵蓋范圍包括了大數據相關硬件、大數據分析軟件和大數據專業服務。其中,大數據專業服務主要是數據交易服務,其涵蓋范圍與本文的數據交易市場更為接近。從全球不同機構給出的統計數據來看,雖然統計覆蓋的范圍可能存在差異,數據市場規模的口徑也有所不同,但基本都圍繞與數據相關的交易和服務開展規模估算。
Statista和Wikibon兩個機構針對全球數據市場的收入規模進行了估算和預測(見表3)。兩個機構對于全球大數據市場規模的估算基本一致。其中,Wikibon還專門估算并預測了“專業服務規模”。根據兩個機構的界定,“大數據市場”是涵蓋大數據相關硬件、軟件和大數據專業服務的廣義大數據產業市場;而大數據專業服務主要就是數據交易服務,其業務規模大致對應于數據交易服務收入總額。根據預測結果,2021年全球數據交易服務收入大約為220億美元,結合數據交易服務收入占成交額的大致比重,則可以進一步估算數據要素的成交規模。如果假定數據交易服務收入占成交額的比重為20%~25%,那么對應的數據要素成交規模大致為880億~1100億美元。
![]()
2022年,IDC和TheLisbonCouncil主導的歐盟數據市場檢測工具報告針對全球主要經濟體的數據市場交易規模進行了估算和預測。該報告將“數據市場”定義為“將數據作為產品或服務進行交換的市場”(IDCandTheLisbonCouncil,2022),其涵蓋范圍包括與大數據相關的信息和IT服務、研究、商業活動及大數據分析服務,與Statistica和Wikibon界定的“數據市場”存在較大差異。IDC和LisbonCouncil報告對數據市場規模的估算參考了數據相關企業在本地區總收入以及從其他地區進口數據產品/服務的價值,因此,在一定程度上反映了數據要素(產品/服務)的交易規模。
報告公布的2019~2021各年估算結果見表4。其中,2021年美國的數據市場交易規模為2399.6億歐元,在前四大市場中的占比約64%,遠高于第2名歐盟27國的636.3億歐元,約為中國的8倍;而中國的數據市場交易規模僅為316.5億歐元,低于日本的399.7億歐元,僅排名第四;美國、歐盟、日本、中國的數據市場交易總規模大約為3752億歐元,由此推斷全球數據市場交易總規模在4000億歐元左右。
![]()
需要指出的是,上述數據市場交易規模涵蓋范圍,既包括大數據相關的軟硬件服務,也包括諸如直接出售數據等大數據相關的商業活動。IDC和The Lisbon Council報告還首次披露了歐盟數據相關企業通過直接出售數據(Data Monetization)所得。2020年,這部分收入達到116.1億歐元,占歐盟整體數據市場規模的19%。如果比照該比例推算,2021年全球數據相關軟硬件服務、研發以及大數據分析活動等業務規模則應該在3000億歐元左右;而數據企業直接出售數據所得,或者說全球數據要素成交規模應該在800億歐元左右,中國的數據要素成交規模則在60億歐元左右。
從增長速度來看,2019~2021年,中國、美國、日本均保持了高速成長的態勢,年均名義增長率都在10個百分點以上,分別為14.3%、13.9%和10.2%;相比之下,歐盟的增速僅為4.35%,明顯低于其他三大經濟體。高成長速度從側面反映出當前全球數據交易市場仍處于初期快速成長階段。
國際數據服務商OnAudience對全球27個國家在線市場營銷領域(主要為數字廣告)的數據交易規模進行了追蹤和測算。表5展示了2017~2021年全球及排名前三在線營銷數據市場交易規模及其在全球占比。從中可以看出,2021年,全球在線營銷數據交易規模達到523億美元,其中,美國市場規模為306億美元,位居全球第一,占比高達58.51%;中國市場雖排名全球第三,但市場規模僅為73億美元,全球占比13.96%,遠低于美國。
需要特別指出的是,基于現有可獲取資料對數據交易規模/成交金額的估算,不僅由于資料來源、覆蓋口徑的不同而存在較大差距,更無法完全反映出數據流動交易的整體規模。一方面,大部分公共數據的流動共享以及基于平臺的雙重交易,本身并不采取交易或貨幣支付的方式,但也是數據流動交易的重要組成部分;另一方面,現有的統計資料以及可公開查詢的企業財務數據,遠不能涵蓋所有以貨幣方式支付的數據交易,例如,眾多企業微觀主體間點對點的數據交易活動一般很難從公開渠道找到對應信息。因此,當下有關數據交易市場的統計,涵蓋范圍主要是那些依托公開交易平臺達成的數據交易活動;而且成交金額往往還需要通過平臺提供交易服務所獲得收入進行間接推算。
(三)數據要素規模結構性特征分析
本部分著眼于生產存儲和流動交易兩個方面,基于不同渠道的公開資源,從數據資源體量和交易成交貨幣價值兩個角度對數據要素規模進行了估算。盡管由于資料來源、范圍口徑等因素使得估算結果存在較大差異,但在此基礎上仍可以提煉出當前數據要素規模方面的一些結構性特征。
首先,近年來全球數據生成規模和數據存儲規模都在持續快速增長,但每年新增數據存儲規模遠小于數據生成規模,僅有4%左右的新生成數據能夠被存儲下來。另外,從存儲能力來看,各主要經濟體的數據存力充足性普遍偏低,排名最高的美國也不足20%,中國更是不足10%。
![]()
第二,中國數據生成規模與數據存儲規模間的失衡更為明顯。得益于超大規模市場和豐富應用場景,中國數據生產能力逐年大幅提升,數據生成規模與美國一起居世界前兩位,但數據存儲率僅為3%左右,明顯低于世界平均水平。從存力充足性指標來看,中國在全球排名僅為11,與排名第1的美國存在顯著差距。
第三,數據要素交易市場尚處于初期快速發展階段,成交規模與數字經濟規模相比顯得微不足道。受到涵蓋范圍、統計口徑以及資料獲取等諸多因素的影響,全球數據流動交易規模估算目前尚無公認的準確測算結果,但不同測算結果在數量級上基本能相互印證。綜合不同機構公布的測算結果推斷,全球公開交易數據的成交規模數量級大致為千億美元,與全球數字經濟增加值規模相差兩個數量級。巨大差距背后既有統計漏算的原因,更源于數據要素市場發展尚處于初期成長階段。
第四,相比美國、日本等國家,中國的數據要素市場發育更不充分。一方面,數據市場交易規模、在線營銷領域數據交易在全球占比均為10%左右,低于歐盟、日本,在主要經濟體中排名第4。另一方面,相比美國、歐盟和日本,中國數據市場成交規模保持著更高的增長率,在四大經濟體中位居第一。當然,中國數據要素成交規模在四大經濟體中的占比可能存在較大幅度的低估,畢竟豐富應用場景必然帶來充足的數據要素交易需求。
五、總結性評論及建議
社會各界高度關注數據要素及其流動交易,但存在過于聚焦個人行為數據和數據交易所模式的誤區。為此,本文前述各部分以數據相關基本概念辨析為出發點,區分比特數據、數據資源和數據要素的內涵,并對數據分類的不同視角進行歸納。綜合既有研究文獻和相關實踐,針對不同類型數據系統梳理其流動交易模式及特點,并綜合不同來源的資料,對全球主要經濟體當下數據資源規模和數據交易規模進行了估算和分析。旨在通過我們的分類、梳理和估算,盡可能客觀全面地呈現數字要素流動交易的基本狀況及趨勢特征。具體來說有如下幾點判斷:
第一,豐富的現實場景決定了數據分類的多樣性,而不同類型數據的涉及主體、權屬劃分、信息密度等特征存在較大差異,由此帶來數據流動交易模式及收益分配的復雜性。促進數據要素安全、有序、充分流動,巫需順應多樣性和復雜性特點,從分級分類等基礎性工作入手,結合數據流動交易實踐需要,逐步構建完善數據分類和流動交易相關制度。
第二,數據流動交易呈現出產品化、服務化和平臺化趨勢特征。原始數據轉移的流動交易模式依然存在,但對于數據需求方來說,原始數據并不能直接滿足其特定應用場景的需要。數據供給方為需求方提供定制化的數據產品或數據服務,既省去了需求方自身加工數據的繁瑣,又實現了數據增值,更為重要的是還能降低原始數據轉移帶來的隱私和信息泄露風險。至于數據交易平臺化則更是體現了數字經濟運行實踐最重要的特征,提高了數據流動交易的效率。
第三,現行統計核算體系是工業經濟時代的產物,沒有也不可能針對數據資源/數據要素提前預設專門的統計分類,不同機構給出的數據要素規模估算,受到資料來源、范圍口徑以及估算方法等因素的影響,存在較大差異。加強數據要素規模估算方面的探索,既是健全完善數據要素流動交易制度的一項基礎性工作,也是數字經濟研究特別是數字經濟測算領域的前沿課題。
第四,全球新生成數據中僅有約4%能夠被存儲,主要經濟體都存在數據生成規模與數據存儲規模失衡,美國情況相對較好,而中國的數據生產與存儲結構性失衡尤為突出。中美兩國所擁有的數據資源和數據生產能力遠遠領先于其他經濟體,但中國的存力充足性指標僅為全球第11,相比美國還有很大差距,數據存儲能力提升空間巨大。
第五,全球數據交易市場整體還處于初期快速發展階段,數據公開交易的成交規模數量級大致為千億美元,與數字經濟增加值規模相差達兩個數量級。在主要經濟體中,中國的數據要素市場發育更不充分,成交規模占比不足10%,不僅遠小于美國,也低于歐盟和日本。
要促進數據要素充分流動,切實發揮數據作為新關鍵要素對經濟增長和社會發展的支撐作用,社會各界都應提高對數字經濟和數據要素的認知水平。在認識到數據要素重要性的基礎上,更要充分意識到數據要素分類和數據流動交易的多樣性、復雜性以及相關制度體系構建完善的艱巨性、長期性,并順應這些特點從基礎制度建設入手,對數據流動交易活動進行引導和規范。
第一,圍繞數據要素本身,完善分類分級、權屬界定等制度建設,為促進數據充分流動交易提供基礎性的制度保障。由行業主管部門牽頭,結合數據生產和數據應用的具體實踐,比照工業和信息化部辦公廳引發的《工業數據分類分級指南(試行)》,針對重點領域、重要場景陸續出臺相應的分類分級標準(或指南),不斷健全數據分級分類制度體系。完善數據要素權屬劃分相關的制度建設,在數據分類分級、確權授權使用基礎上,細化、明確不同類型數據持有權、使用權、經營權等相關權屬邊界,為數據共享流動各環節參與者、利益相關者的正當權益提供法律和制度保障。
第二,加強存儲中心、算力中心等數字基礎設施建設,提高存力、算力充足性水平,保障數據資源的收集、存儲。以“東數西算”等國家級戰略為基礎,對算力中心和存儲中心建設規劃進行細化;除了現有的8個國家級樞紐節點外,還可以考慮在其他具備氣候、電力等相對優勢的西部地區布局建設更多存儲中心。
第三,培育一批數據要素交易和開發利用的專業化機構,充分發揮企業的市場主體作用及技術優勢。數據要素的市場化配置及價值挖掘,對技術能力、專業積累等要求較高,應充分調動數據企業的積極性。一方面鼓勵企業,特別是互聯網巨頭企業更多參與數據交易環節,通過提供數據產品和服務,更好盤活數據資源,推動數據要素市場規模增長。另一方面,借助企業在數據資源、數字技術、應用場景等方面的專業積累,為政府部門和各類市場主體提供專業化的產品和服務,提升數據要素市場的交易和服務質量。
第四,建設并完善數據治理體系,統籌好數據流動中的安全與發展。充分保護數據信息安全、推動數據相關行業領域健康發展,需要參與各方加強對關鍵領域數據的保護,事前、事中、事后做好風險預警、安全評估和事后追溯;市場監管部門、行業主管部門和司法部門發揮數據治理主導作用,確保司法和執法全面到位,在鼓勵和引導數據新興商業模式創新發展的同時,防止出現數據壟斷、價格歧視等問題。此外,健全數據跨境流動相關的安全審查制度和雙邊多邊合作機制,為實現數據在更大范圍內的流動交易保駕護航。
第五,支持并鼓勵數字相關核心關鍵技術創新和突破。數據實現安全、有序、充分流動不僅需要制度和相關產業政策的保障和支持,更需要核心技術提供堅實的物質基礎。一方面,守住數據安全底線,實現數據可靠溯源、安全存儲和傳輸以及數據可用不可見,在數據流動交易中維護國家數據安全、防止個人隱私和商業機密泄露,需要安全多方計算、區塊鏈等較為成熟可靠的技術提供保障。另一方面,數據資源的開發利用需要充足的數據存儲能力和算力,存儲介質方面固態硬盤占據主導的趨勢已經形成,而其核心的閃存顆粒目前被國外寡頭壟斷。唯有切實解決好此類核心關鍵技術卡脖子問題,才能更好地發揮數據要素支撐經濟發展作用。
參考文獻
[1] 蔡躍洲、馬文君,2021,《數據要素對高質量發展影響與數據流動制約》,《數量經濟技術經濟研究》第3期。
[2] 常江、張震,2022,《論公共數據授權運營的特點、性質及法律規制》,《法治研究》第2期。
[3] 田杰棠、劉露謠,2020,《交易模式、權利界定與數據要素市場培育》,《改革》第7期。
[4] 中國信息通信研究院,2022,《中國存力白皮書(2022年)》。
[5] Acquisti,A.,C.Taylor,and L.Wagman.2016.“The Economics of Privacy.” Journal of Economic Literature,54(2):442–92.
[6] Bergemann, D. and A. Bonatti. 2019. “Markets for Information: An Introduction.” Annual Review of Economics,11:85–107.
[7] CAICT and Chinese Academy of Cyberspace Studies(CACS). 2021. National Data Resources Survey Report(2020).
[8] European Commission, Directorate-Generalfor Communications Networks, Contentand Technology, Scaria,E., Berghmans, A., Pont, M., etal. 2018. Study on Data Sharing between Companies in Europe: Final Report, Publications Office.
[9] Farboodi, M., and Veldkamp L. 2021. “A Growth Model of the Data Economy.” NBER Working Paper, No.28427.
[10] Federal Trade Commission. 2014. “Data Brokers: A Call for Transparency and Accountability.”
[11] IDC and The Lisbon Council. 2022. European Data Market Study 2021-2023(D2.1 First Report on Facts and Figures). Luxembourg: Publications Office of the European Union.
[12] Laudon, K. C. 1996. “Markets and Privacy.” Communications of the ACM, 39(9):92–104.
[13] Malgieri, G., and Custers B. 2018. “Pricing Privacy-The Right to Know the Value of Your Personal Data.” Computer Law & Security Review, 34(2):289-303.
[14] Mitchell, John, Daniel Ker a nd Molly Lesher. 2021. “Measuring the Economic Value of Data.” OECD Going Digital Toolkit Note, No.20.
[15] Nguyen, D. and M. Paczos. 2020. “Measuring the Economic Value of Data and Cross-border Data Flows: A Business Perspective.” OECD Digital Economy Papers, No.297.
[16] OECD. 2013a. “Exploring the Economics of Personal Data: A Surveyof Methodologies for Measuring Monetary Value.” OECD Digital Economy Papers, No.220.
[17] OECD. 2013b. “Introduction to Data and Analytics(Module1): Taxonomy, Data Governance Issues and Implications for Further Work.” DSTI/ICCP(2013)13
[18] OECD. 2021. Issues Paper: Recording Observable Phenomena and Data in the National Accounts. Paris: OECD Publishing.
[19] Reinsel, D., J. Gantz, and J. Rydning. 2017. Data Age 2025. IDC
[20] Statistics Canada. 2019. “The Value of Data in Canada: Experimental Estimates.” Latest Developments in the Canada Economic Accounts (Working Paper Series),No.9
[21] Swedish National Board of Trade. 2015. NoTransfer, No Production: The Importance of Cross–border Data Transfers for Companies Based in Sweden. Stockholm: Swedish National Board of Trade.
[22] The State Internet Information Office. 2022. Digital China Development Report (2021).
[23] United Nations Conference on Trade and Development (UNCTAD). 2021. Digital Economy Report 2021 Cross–border Data Flows and Development: For Whom the Data Flow. Geneva: United Nations Publications.
[24] Varian, H. 2018. “Artificial Intelligence, Economics, and Industrial Organization.” NBER Working Paper, No.24839.
[25] Veldkamp, L., and C. Chung. 2019. “Data and the Aggregate Economy.” Journal of Economic Literature, forthcoming.
China Economist (中文刊名:《中國經濟學人》)是由中國社會科學院主管、中國社會科學院工業經濟研究所主辦的面向全球發行的中英文學術期刊。China Economist創刊于2006年3月,始終致力于向全球傳遞中國經濟學與管理學最前沿研究進展,搭建中外學者相互交流的學術平臺和研究陣地,向全世界宣傳能夠代表中國人民根本利益訴求的研究成果,促進國外讀者更好地了解中國,不斷增強我國的國際影響力和國際話語權。《中國經濟學人》先后被EconLit、EBSCO、ProQuest、SCOPUS等全球主流、權威數據庫及索引系統收錄,入選中國社會科學院中國人文社會科學期刊(AMI),是“代表我國人文社會科學英文刊最高水平”的期刊。
在線投稿系統:http://ceji.cbpt.cnki.net
官方網站:http://www.chinaeconomist.com/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.