![]()
“有些人走著走著就散了。
十幾年前,當中美兩國的工程師們都在熱烈討論Hadoop、Spark和開源社區時,他們仿佛站在同一個新大陸的海岸線上,共享著同一套工具和幾乎一致的技術信仰。
那是以技術為驅動、以效率為圭臬的黃金時代。彼時,中國的互聯網巨頭,如阿里巴巴和騰訊,是Hadoop和Spark生態的早期、大規模采用者,它們試圖解決的是與硅谷同行們類似的、爆炸式增長帶來的海量數據處理難題。
如今,圖景已截然不同。
在2025年的硅谷峰會上,美國數據巨頭Snowflake和Databricks的舞臺中央,主角是AI智能體。他們向成千上萬的開發者展示的是,不懂代碼的業務人員如何用純英語與海量數據對話,AI如何自動編寫SQL,甚至自動將競爭對手的代碼智能遷移過來。
而在同期的中國,大數據產業的核心落地場景,是服務于指揮中心和戰略駕駛艙的數據大屏。
從賦權個體到賦權決策,從智能工具到治理系統。中美大數據產業不僅沒有趨同,反而走向兩個平行的未來。這種分歧并非偶然的技術路線差異,而是源自更根本的差異:兩國對數據這一核心生產資料的定義不同——中國已在國家戰略層面將數據定義為一種有待激活的新型生產要素;而美國和西方則在法規和文化的雙重作用下,將數據視為一種需要管控的法律責任。
數據要素vs數據責任
中國的頂層設計中,數據被賦予了前所未有的戰略高度。從十四五規劃到2022年石破天驚的數據二十條,數據被明確定義為與土地、勞動力、資本、技術并列的第五大生產要素,成為基礎性國家戰略資源。
![]()
這是一套激活與流通的邏輯。當西方法規在研究如何規制數據時,中國的制度在探索如何激活數據,致力于激活數據要素潛能,做強做優做大數字經濟。
最關鍵的機制創新在于“數據二十條”所提出的三權分置,該制度大膽地探索將數據產權進行結構性分置,劃分為數據資源持有權、數據加工使用權、數據產品經營權。它深刻地揭示出,數據的非競爭性和產權模糊性使得傳統的所有權概念在數據領域陷入僵局。西方在誰擁有數據的法律戰陷入權利攻防之時,中國則通過三權分置繞開了這個問題。
正如“數據二十條”所強調的,要淡化所有權、強調使用權。通過將權利解綁,中國允許數據的價值在市場上合法流通和交易,而無需解決那個棘手的、近乎無解的原始數據歸屬問題。
與中國統一的、自上而下的數據要素戰略不同,美國數據治理呈現出一種各自為政的圖景,各州法律,譬如加州的CCPA、弗吉尼亞州的VCDPA等,和各行業法規,如醫療的HIPAA、金融的GLBA,共同組成監管體系。
與此同時,對美國數據文化影響最深遠的,還有來自歐盟的《通用數據保護條例》。GDPR強大的域外效力,迫使所有希望與歐洲做生意的美國企業,必須將處理個人數據視為一種高風險的法律責任。
GDPR和CCPA共同在美國企業中催生了合規驅動的文化。數據不再首先被視為“機遇”,而是首先被視為一種法律和聲譽上的風險。企業的首要目標不是最大化數據價值,而是最小化違規風險。這種防御性心態直接催生了合規科技和隱私技術棧。
可以說,中國的國家資本和政策導向正致力于建設數據流通的基礎設施,而美國的市場資本和企業支出則正忙于構建數據防御的基礎設施。
兩種數據與產業的融合路徑
對數據的微妙態度并非僅停留在抽象的政策文本中,而是直接決定了中美兩國數據產業的微觀技術路線和商業模式。
在美國,為解決數據治理和管理的難題,市場驅動和資本驅動的路徑帶來了技術化和產品化的空前繁榮。以Snowflake和Databricks為代表的現代數據棧是這一路徑的巔峰之作。Snowflake的“三層解耦”架構和Databricks的Lakehouse(湖倉一體)架構都是為了解決分析這個核心問題。它們為企業IT和分析團隊提供了前所未有的彈性、可擴展性和易用性。
然而,這種模式的B面,恰恰是其無法下沉到具體的、深入的產業運營場景中。這種過度依賴標準化產品的創新路徑,使其在面對深度行業需求時顯得力不從心。
以Snowflake為例,這類云數據倉庫是卓越的分析引擎,但在應用后端的表現則差強人意。它們的設計目標是支持商業智能、分析和內部報告,而非面向用戶的高并發、低延遲應用。具體行業將數據智能嵌入其核心交易或運營系統時,需要的是高并發和低延遲,而標準化數倉在這一場景下,要么成本高昂,要么用戶體驗緩慢。
更根本的問題在于,這種中心化數據平臺模型在結構上就不適合支持真正的數字化轉型。當來自制造業、醫療、運輸等不同領域的數據被抽取、清洗并匯入一個中心化的、標準化的平臺時,它們最有價值的領域特定上下文不可避免地被稀釋和丟失了。
因此,美國的產品化路徑,在追求橫向擴展性的同時,犧牲了縱向穿透性。
![]()
中國的路徑截然不同。如果說美國數據產業的超級客戶是企業IT部門和資本市場,那么中國數據產業早期的超級客戶只有政企和金融等機構。這種由大B和大G端需求和公共數據開放授權為牽引的模式,天然地塑造了數據產業的供給形態——項目制和定制化交付。
在西方的從業者視角看來,這種項目制模式是“落后”的,因為它缺乏可擴展性、利潤率低、不是好的SaaS生意,但這是一種誤讀。
從中國數據要素戰略的角度看,項目制不是需要被克服的弱點,而是實現其戰略目標所必需的、被有意選擇的優勢。中國的戰略目標不是打造一個可無限復用的單一數據產品,而是要打造一個數據要素與實體經濟深度融合的產業生態。
實際操作層面看,項目制是實現“下沉”的重要手段,它能最大程度地深入產業的肌理。
譬如《“數據要素×”三年行動計劃》,就提出在金融服務領域要融合“科技、環保、工商、稅務、氣象、消費、醫療、社保、農業農村、水電氣”等多源數據,以“依法合規優化信貸業務管理和保險產品設計及承保理賠服務”。
這種跨越多主體、融合多維度、服務于特定場景的深度需求,必須通過項目制和定制化交付,在特定的場景中才能得以實現。
所以,美國模式的無法下沉是其標準化設計的必然結果,而中國的項目制則是數據要素與產業結合戰略的必然選擇。
AI時代的技術終局
在人工智能時代,中美走向了兩個差異顯著的發展路徑,兩種截然不同的數據智能。
美國路徑的邏輯終點,是依循賦權個體、標準化產品、市場驅動的路徑,通往AI智能體。以Snowflake和Databricks為代表的平臺,其AI戰略的核心是AI副駕駛。它們的目標是讓分析師、營銷人員、開發者等個體能夠通過自然語言,自助式地完成過去需要一個數據團隊才能完成的復雜工作。
這種自下而上的智能范式,追求的是個體生產力的最大化。它將數據智能封裝在易用的工具中,分發給組織中的每一個人,以期帶來效率的倍增,終極使命是優化組織中個體或團隊的決策和生產力。
而中國路徑則通往戰略駕駛艙。一些觀察者認為,中國大數據產業在AI時代卡在了可視化的低級階段。事實上,中國的大數據產業,正在無限接近向數據智能的驚險一躍。
數據智能是一個更廣泛的范疇,它涵蓋了收集、整合、分析和展示數據的全過程,其目的是支持組織內的決策制定和戰略規劃。換言之,數據可視化只是數據智能的一部分,真正的智能隱藏在屏幕背后。
這類“屏幕后”的智能更接近AI時代的個性化管理,它由多源數據融合引擎支撐,執行著用數據要素結合實體經濟復雜任務,其目標用戶不是分析師,而是更高層級的管理者,其作用不單是提升個人效率,更是提供全局視野和宏觀治理能力。
![]()
這是一種自上而下的智能范式,追求集體決策的最優化,將分散的數據要素匯聚起來,以實現戰略層面的指揮和控制。
回望大數據這十年,中美兩國從Hadoop和Spark的同一片海岸出發,如今已行駛在兩條平行的軌道上,各自承載著不同的使命,駛向各自的星辰大海。
美國模式圍繞產品、資本、責任,在數據責任的合規文化和活躍資本的推動下,形成了一套以標準化產品為核心的產業路徑。其優勢在于擁有全球最快的產品迭代能力和最活躍的開源生態;其困境在于高昂的合規成本,以及標準化產品無法下沉到深度產業運營中的結構性限制。
中國則在政務需求牽引下,聚焦數據要素的國家戰略,形成一套以定制化項目為抓手的產業路徑。其優勢在于能以強大的國家意志完成龐大的數字基建,并通過項目制實現數據要素與實體經濟的深度下沉融合,也面臨著如何平衡項目制的定制化與平臺化的規模效應等挑戰。
在數字時代的浪潮中,兩國基于自身截然不同的文化、經濟結構和治理需求,做出了不同的戰略選擇,誰會率先走向真正的數據智能,還需要時間來驗證。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.