建立數據標準,避免“先汙染後治理”

近年來,數據治理的概念越來越火,為積極響應國家的號召,各企業和單位紛紛開始進行數據治理。一方面傳統的大數據注重於短期內產生經濟效益,主要是對數據進行存儲和管理;另一方面,數據治理的成本大,短期內很難產生明顯的收益,企業前期不願意投入時間和精力做數據治理。

隨著企業的發展,對數據的要求更高,原始的數據管理難以支撐現有日常業務和更復雜的分析應用,企業開始由數據管理走向數據治理,但是由於前期沒有對數據標準建設、質量把控,在數據汙染之後再進行治理難度更大、成本更高。

“先汙染後治理”難度大、成本高

以銀行為例,我國銀行業的信息化建設歷經二十年的發展,目前已建立較為完備的信息系統,雖然近年來國家監管層面不斷完善數據治理工作,但目前商業銀行數據管理仍存在一些突出問題:機構間統計標準不一致,數據蒐集整合存在錯配;數據管理部門與銀行業務部門之間未能形成良好協同,導致數據收集流程效率低下;數據挖掘與數據應用力度不足等。

2018年5月21日,銀保監會正式發佈《銀行業金融機構數據治理指引》,對銀行業金融機構數據治理的原則理念、數據治理架構、數據管理、數據質量控制、數據價值實現,以及對銀行業金融機構數據治理的監督管理等做出了規定。在硬性規定下,為實現監管報送數據的合法合規,銀行業紛紛開始進行數據治理。

建立數據標準,避免“先汙染後治理”

從目前的情況來看,因為數據已存在諸多問題,要看到數據治理的成效帶來的明顯收益,至少需要3年時間,並且需要投入大量人力物力,梳理歷史問題數據;而如果之前就進行數據標準建設,後期數據發揮效益可能就只需要1年的時間。這樣看,先汙染後治理的成本明顯更高。

如何通過數據標準建設,避免“先汙染後治理”

億信數據標準管理平臺通過統一的數據標準制定和發佈等一系列的活動,結合制度約束、系統控制等手段,實現企業大數據平臺數據的完整性、有效性、一致性、規範性、開放性和共享性管理,為後續數據質量檢查、數據安全管理等提供標準依據,通過數據標準模塊可以有效的避免數據先汙染後治理。當然,如何更有效地發揮產品作用,還離不開企業正確的數據觀念。總結以下三點:

一、梳理和制定數據標準

企業的數據標準來源非常豐富,有外部的監管要求,行業的通用標準,同時也必須考慮到企業內部數據的實際情況,從業務著手,梳理其中的關鍵的業務指標、數據項、代碼等,通過數據標準模塊對評審通過的標準統一的線上進行管理維護,業務部門可以及時獲取權威的數據標準,通過制定標準評審的流程對標準進行維護和變更,確保每一次的變更都是權威有效的,不斷地完善數據標準體系。

二、數據標準的落地和實施

事先確定好哪些數據標準需要落地以及哪些系統需要進行落地,再執行可進行落地的方案,通過數據標準落地評估定期產出數據標準評估報告,對於不達標的元數據進行通報並進行改造;同時需要定期的對元數據標準覆蓋率進行檢核分析,定期產出元數據標準覆蓋率分析報告,雙向評估數據標準的落地情況,不讓數據標準成為一紙空談,失去標準本身的價值。

三、企業應該樹立的正確數據觀念

只有標準化的數據才有價值,支撐數據分析和應用。數據要發揮其價值,首先要保證數據的合法合規的,數據標準作為數據治理中一項重要的工作內容,有的人會認為數據標準幾乎沒什麼用,做了大量的梳理,建設了一整套全面的標準,最後還不是被束之高閣,被人遺忘,幾乎沒有發揮任何作用。企業應該樹立正確的數據觀念,協同多部門制定數據標準體系才能更好地推動企業數字化建設。

建立數據標準,避免“先汙染後治理”

小結:數據的問題要從根本上解決,就必須從源頭控制數據的質量,提前做好數據的規範以及數據管理的規範可以有效的從源頭解決大部分數據問題。提前通過數據標準建設,將類似數據缺失、數據異常、數據不一致等後期需要投入大量人力物力解決的“髒數據”,統統扼殺在搖籃裡,可以有效降低後期數據治理難度與成本。


分享到:


相關文章: