作為信息化老兵,在三十年的工作經歷中,感覺最無力的就是辛辛苦苦建設的信息系統,最終淪為了花架子,成了領導檢查時的演示系統,因為里面的數據不準確、不真實,無法給各級領導決策時起到支撐作用。這種無力感,隨著這幾年企業形勢越來越嚴峻,經營越來越困難,錢越來越不好掙,數字化轉型推進越來越艱難,眼睜睜地看著這些系統無法發揮作用卻無能為力,越感覺深刻。
數據不準確,不是信息系統的問題,是有著復雜的原因,信息系統只不過是把問題擺在了桌面上,顯性化了,而問題本身并沒有解決。要想解決這個深層次的問題,就必須開展數據治理。
“醉翁之意不在酒,在乎山水之間也。”數據準確性、及時性的問題不在數據本身,而在數據產生、管理、使用背后的一系列問題,所以數據治理是比較困難的,因為它不僅僅是個技術問題,而是涉及到技術、流程、組織、文化等一系列的問題。要想把數據治理好,在企業經營管理中發揮作用,真正成為企業的資產,就必須用中醫的辦法,綜合施治,群策群力。
老規矩,從三個方面來探討這個問題:一是什么是數據治理;二是數據治理的難點;三是數據治理有沒有什么好辦法。
先說第一個,什么是數據治理?
按照有關權威的說法,數據治理是指在一定的組織范圍內,依托制度法規、標準規范、應用實踐和支撐技術對數據進行全生命周期的數據確權、質量管理、安全控制、隱私保護、開放共享、交易流通和分析處理。
這個定義有些拗口,相較之下,國際數據治理研究所(DGI)給出的定義,就比較通俗易懂:數據治理是一個通過一系列信息相關的過程來實現決策權和職責分工的系統,這些過程按照達成共識的模型來執行,該模型描述了誰(Who)能根據什么信息,在什么時間(When)和情況(Where)下,用什么方法(How),采取什么行動(What)。
數據治理與數據管理有聯系,也有所區別。數據管理涵蓋了從數據采集到處理、保護、存儲和利用的整個數據生命周期。數據治理是數據管理中的一個組成部分,專注于制定策略和規則,以確保數據的質量、安全性和合規性。而數據管理不僅包括這些治理活動,還涉及實際執行和操作層面的任務,如數據處理、數據存儲、數據安全、數據架構設計等。
第二個,數據治理的難點是什么?
數據治理之所以被普遍認為“很難”,主要體現在以下幾個方面:
一是跨部門協作與組織變革的阻力。數據通常分散在不同部門、不同系統中,各自為政。打破壁壘,實現跨部門的數據共享和協作,需要強大的政治意愿和組織推動力。很多企業的數據所有權、管理責任、使用權限、利益分配等界定模糊,導致互相推諉或爭奪控制權。另外,改變現有工作流程、增加數據管理負擔、挑戰部門或個人“領地”會遭遇阻力。員工可能不理解、不認同或缺乏動力參與數據治理。同時,坦率地說, 數據治理是長期投入、見效相對慢的工作。缺乏高層的持續、有力支持和資源投入,極易夭折或流于形式。
二是技術的復雜性。每個企業,仔細梳理下,就會發現,各式各樣的數據不僅量大,而且,種類多,海量結構化、半結構化、非結構化數據從不同源頭高速涌入,治理難度指數級增加。與此同時,數據質量低下,數據不準確、不一致、不完整、過時、重復等問題普遍存在,提升數據質量需要持續的投入和復雜的流程。如何能夠有效管理數據的定義、來源、血緣關系、質量規則等元數據,本身就是一個龐大復雜的工程。
三是流程定義與持續執行。一般的企業,都缺乏標準化的數據采集、存儲、處理、訪問、使用、歸檔、銷毀等流程和標準。有些即便制定了流程,如何將其嵌入到日常業務操作中,確保員工遵守,并有效監控執行情況,也是個巨大的挑戰。
四是人員技能與文化塑造。一般企業,都缺乏既懂業務、又懂數據、還懂治理技術的復合型人才,對數據價值、數據風險和數據管理基本知識的認知和理解都很淺薄。“數據是核心資產”、“數據質量人人有責”、“數據驅動決策”等數據文化的建立還需要長期不懈的努力。
第三,數據治理有什么好辦法?
數據治理是一個系統性工程,要從組織、流程、技術、文化多維度推進,以業務價值為導向,先解決主數據不一致等痛點,再逐步構建體系化能力。
首先,開展基礎治理。開展數據標準化治理,建立數據字典,明確字段名稱、類型、格式等,再將將業務口的“語言”進行統一,比如,在描述“活躍用戶”的時候,各個業務口的理解是不一樣的,這樣的描述就比較模糊,容易產生歧義,如果改成“近30天登錄用戶”就比較規范,能做到思想統一。
其次,要提高數據的質量。將數據采集的質量納入員工考核,建立數據的全生命周期追責機制,對數據進行清晰、校驗。
第三,制定數據標準。統一數據的定義、格式和編碼,建立安全規范,明確哪些數據能訪問、誰能訪問、怎么訪問。制定質量規則,規定數據必須準確、完整、及時。
第四,持續推進。數據治理是以支撐組織戰略和長遠發展為目標,應當不斷吸收新的數據來源,持續追蹤數據問題并不斷改進,所以數據治理工作不應當是一錘子買賣,應當建立長效的數據改進機制。
第五,選擇合適的工具。目前,市面上的元數據管理工具、數據質量管理工具、主數據管理工具、綜合數據治理平臺等很多,有些還是開源的。不要盲目跟風,“適合的才是最好的”,要選擇適合自己企業的工具。
總之,數據治理是一項長期工程,開展起來很難,長期堅持就更難了。但再難,也要開展,不進行數據治理,那些花了大價錢建設的應用系統就成了花架子、擺設,用不好,就得不償失。
![]()
文件硬盤數據銷毀
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.