03.07 數據湖、數據倉庫、數據中臺,有什麼區別?

宋美昕


數據湖、數據倉庫和數據中臺,他們並沒有直接的關係,只是他們為業務產生價值的形式有不同的側重。

數據湖作為一個集中的存儲庫,可以在其中存儲任意規模的所有結構化和非結構化數據。在數據湖中,可以存儲數據不需要對其進行結構化,就可以運行不同類型的分析。

數據倉庫,也稱為企業數據倉庫,是一種數據存儲系統,它將來自不同來源的結構化數據聚合起來,用於業務智能領域的比較和分析,數據倉庫是包含多種數據的存儲庫,並且是高度建模的。

數據中臺是一個承接技術,引領業務,構建規範定義的、全域可連接萃取的、智慧的數據處理平臺,建設目標是為了高效滿足前臺數據分析和應用的需求。數據中臺距離業務更近,能更快速的相應業務和應用開發的需求,可追溯,更精準。

數據湖、數據倉庫更多地是面向不同對象的不同形態的數據資產。而數據中臺更多強調的是服務於前臺,實現邏輯、標籤、算法、模型的複用沉澱。

數據中臺像一個“數據工廠”,涵蓋了數據湖、數據倉庫等存儲組件,隨著數據中臺的發展,未來很有可能數據湖和數據倉庫的概念會被弱化。

小結

數據空間持續增長,為了更好地發揮數據價值,未來數據技術趨於融合,同時也在不斷創新。


分享到:


相關文章: