![]()
“火山引擎、阿里云、AWS躬身入局,數據飛輪或將成為數據中臺的“接班人”。
曾經風靡一時的“數據中臺”,如今正陷入Gartner所言的“泡沫低谷期”——數據積壓成山,卻鮮有流動;建設投入巨大,卻難以自我生長。
當下,企業數字化轉型已進入深水區,亟需尋找新的技術“錨點”。
根據國際數據公司IDC預測,2025年全球數據量增速為26.9%,預計2029年全球數據量將達527.47ZB,但中國市場的數據留存率僅為5.1%,利用效率低。
在這種背景下,“數據飛輪”作為一種新興理念正引發越來越多企業的關注。它將數據視為一個持續流動、不斷創造價值的要素,通過“數據-洞察-行動-反饋”的閉環機制,讓數據自動循環,雖然一開始需要較大的推動力,但隨著數據的積累和正反饋循環的加速,最終實現自我驅動。
![]()
2024年中國數據、分析和人工智能技術成熟度曲線
圖片來源:Gartner
那么,何謂數據飛輪,有哪些核心玩家,他們都是怎么做的?接下來,讓我們一起來探討這些問題。
數據中臺式微時,
數據飛輪為何成為新風向?
曾經,數據中臺通過數據服務化和共享,打破了企業數據孤島的現狀。但隨著數字化建設逐漸趨于實際應用,企業逐漸意識到,僅靠數據的“大一統”尚難滿足業務需求。海量數據若無法形成有效流轉,便難以釋放實際價值。伴隨著人工智能的發展,如何讓海量數據有效地運轉起來?數據飛輪應運而出,為破解數據價值轉化難題提供了系統性方案。
數據飛輪的概念借鑒了物理學中的“飛輪效應”——初期推動需要較大投入,但一旦轉動起來,系統便會自主運轉、持久蓄能。該理論由管理學家吉姆·柯林斯提出,后經亞馬遜CEO貝索斯在商業實踐中進一步發展。2001年,貝索斯團隊提出的電商飛輪模型揭示核心邏輯:低價吸引更多客戶,客戶規模擴大帶動第三方賣家入駐,進而攤薄物流與運營成本,成本降低又支撐更低價格,形成自我強化循環。隨著數智化深入,這一模型被賦予數據維度新內涵,演進為“數據飛輪”——以數據消費為核心,業務產生的數據反哺數據資產建設,優化后的資產再賦能業務發展,實現螺旋式上升。
![]()
飛輪效應在亞馬遜的商業應用應用示意圖
來源:亞馬遜
數據中臺是地基,數據飛輪則是其上高樓。與傳統數據中臺相比,數據飛輪實現了理念升級。數據中臺多聚焦數據集中存儲與管理,易淪為“成本中心”;而數據飛輪更強調數據流與業務流深度融合,以“用數據”為核心目標,通過持續價值輸出證明商業價值。這種從“資產導向”到“應用導向”的轉變,是數據飛輪在實踐中展現強大生命力的關鍵。
![]()
數字時代的數據飛輪架構
圖片來源:《清華管理評論》2024年4月刊
借助數據飛輪,決策和數據的因果關系得以轉換,數據及知識驅動業務決策的方式能夠從直接驅動決策轉變為輔助支持決策。清華大學經濟管理學院的研究《AI時代如何構建數據飛輪》顯示:在過去,業務較為穩定,知識可以長期應用于未來的業務場景,企業對業務人員決策能力的需求較低。而當前,業務正在快速變化,人們需要不斷作出大量新的決策來持續優化流程。因此,需要調用能夠還原先前場景的底層數據,而不是先前場景下產生的最終知識來輔助思考,從而產生適合于當下場景的決策和工作流程。
據飛輪實戰圖鑒:
三大巨頭如何用數據驅動行業增長
業界玩家積極布局數據飛輪相關技術產品,比較典型的如國內的火山引擎、阿里云,以及AWS這樣的國際玩家。
1.火山引擎——數智平臺、多模態數據湖、數據飛輪2.0
火山引擎把“數據飛輪”寫進了自己的產品定位:強調以數據消費為核心、打通多模態:文本、圖像、音視頻、事件流的湖倉能力,并給出一整套從算子、異構計算和模型訓練到部署的鏈路:VeDI、多模態數據湖、數據全鏈路產品。廠方資料與技術文章里反復提到把大模型訓練與企業業務鏈路結合,形成“消費—資產—應用”雙輪聯動。
![]()
火山引擎數據飛輪 2.0 模式圖
來源:火山引擎數智平臺
2.阿里云——大數據與AI平臺MaxCompute、PAI等結合
阿里云的技術棧長期圍繞大數據倉庫MaxCompute、實時計算、數據中臺與AI平臺PAI,把從數據存儲、批流計算、特征工程到模型訓練、線上部署的環節一體化,強調把企業業務數據變成可重復的智能服務。
3.AWS——模塊化的“Data Flywheel”方法論+MLOps工具鏈
AWS把數據飛輪作為方法論來推廣,強調不是單一產品而是一整套組件:存儲、編目、訓練、推理、監控與治理協同工作;并通過具體的MLOps、Flywheel實踐, 例如Amazon Comprehend的Flywheel機制演示如何把數據湖、版本化數據集和自動化訓練串成閉環。
行業應用落地:
數據飛輪的 “價值綻放”
技術產品的價值最終在行業場景中顯現,三家企業的飛輪應用各具特色,卻都實現了數據價值與業務增長的雙贏。
1.火山引擎—電商、品牌運營里的“快速試錯→精準放量”飛輪
火山引擎把VeCDP+增長分析DataFinder+A/B 測試DataTester+智能洞察DataWind連成閉環——先把全域行為打通并建標簽,數據入湖,用增長分析發現高潛用戶和爆款線索,用 A/B 實驗驗證運營策略,把成功策略在更多觸點放量,進一步產生更干凈的訓練/統計數據,飛輪越轉越穩。
2.阿里云—供應鏈與大規模零售與物流場景的“實時決策”飛輪
阿里云的“打法”是以MaxCompute、Hologres、實時計算Flink、機器學習能力PAI為核心,構建一體化的數倉湖:實時流入的運單、車輛、倉庫狀態驅動模型產生調度和路徑建議,調度結果和服務質量又不斷回流成訓練數據、治理指標與業務規則,形成持續優化的閉環,提升配送準時率、降低成本與庫存占用。而且,阿里云給供應鏈與零售的大客戶提供了這一整套落地工具與實踐。
3.AWS—跨國化產品、媒體與組合化飛輪方法論
時下,流媒體、國際電商或多地域服務商,需要把海量用戶行為和內容表現做成可復制的個性化推薦引擎,并在不同市場不斷迭代模型。AWS不只賣單個服務,而是把數據湖、編目Glue、訓練、托管SageMaker、行業托管服務如Amazon Personalize、Comprehend的Flywheels等,拼成可插拔的飛輪工具箱。以 Amazon Comprehend的“Flywheel”功能為例,它能把模型訓練—評估—部署—采集反饋自動化,縮短模型從“學到用”再到“學新的”周期。
為了更清楚的對比各個玩家的差異,我們做了如下的分析表格:
![]()
前途光明,但道路曲折
如同許多正在發展壯大中的新技術一樣,盡管數據飛輪前景廣闊,但在落地過程中仍面臨多方面挑戰。技術層面,大模型“幻覺”問題仍未完全解決,影響分析結果可信度,這是困擾很多廠商的問題;多源數據融合、實時性與一致性難以兼顧。
數據飛輪強調“以數據消費促數據生產”,但企業員工的數據消費意識和能力往往不足,業務人員數據消費意愿低,仍依賴技術團隊驅動。這種狀況間接導致在組織與流程方面,數據與業務團隊協同困難,缺乏“數據BP”角色。數據飛輪需持續迭代,傳統項目管理方式需要更新變革。
成本與投入問題也是企業尤其是中小企業面臨的重要障礙——數據飛輪初期建設成本高,ROI難以短期量化。對中小企業而言,技術學習門檻和建設門檻仍較高。
展望未來,數據飛輪將繼續演進,并呈現出以下幾個明顯趨勢:
·更低門檻的AI交互將成為數據飛輪普及的關鍵。例如,衡石科技正探索通過語音識別、AR、VR等技術,實現“對話+視覺”的沉浸式分析體驗。
·更智能的數據反饋機制是數據飛輪持續優化的核心。隨著AI和機器學習技術的發展,數據分析將變得更加智能,自動生成洞察和行動策略。
·更廣泛的行業適配將推動數據飛輪在更多場景落地。從零售、制造到醫療、金融,數據飛輪的理念和方法正在不同行業中得到驗證和推廣。
數據飛輪的本質是一場從“數據工程”到“認知工程”的范式轉變。當數據流動速度超過業務迭代周期時,將產生指數級價值放大效應。AI原生將成為數據飛輪的核心特征。
如果說數據飛輪1.0的關鍵詞是“整合”,2.0是“賦能”,那么未來3.0階段將實現“共生”——AI不僅是工具,更成為數據飛輪的內在驅動核心。
我們認為,數據中臺沒有被淘汰,它完成了自己的使命。那一階段,企業需要秩序、標準和統一的視圖。
如今,問題變了。數據量激增,反饋周期縮短,企業開始關注如何讓系統自己學習。數據飛輪的出現,是一種自然的遷移——從集中治理,走向動態循環。
它不是取代,而是接力。中臺讓企業看清過去,飛輪讓企業適應未來。前者建立穩定,后者追求速度。
真正的分水嶺,不在概念,而在組織。誰能把數據嵌入決策、讓AI介入執行,誰就能讓增長自己運轉。
技術史從不重復,它只會在不同形式下推進同一個命題:讓系統,變得更聰明,更有用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.