數據模型,數字化轉型的核心能力

業界數字化轉型已經進入深水區,數據越來越受到大家重視,由於數據中臺等等概念的興起,大家越來越回到數據的根本問題“數據模型”。今天不談論高大上的數據中臺,我想回到數據的本源,談談接地氣的數據模型。

数据模型,数字化转型的核心能力

一、什麼是數據模型

我們可以先看一下生活中的模型的例子,房屋平面圖、地圖等都是很好的模型的示例。

對於下圖的房屋平面圖來說,我們基本看一眼就能知道這是一個三室兩廳兩衛的房子,有一個玄關和一個陽臺,哪裡是門,哪裡是牆,哪裡是窗戶,每個房間的平米數是多少,全部都用各種符號表示得一清二楚。

對於地圖來說,我們也知道綠色的部分一般都表示公園,藍色的部分表示湖,黃色的粗線表示高速公路……

数据模型,数字化转型的核心能力

圖 1生活中的“模型”(圖片來源與網絡)

數據模型是用於描繪、溝通數據需求的一組簡單易懂、標準的,並且便於計算機實現的標準符號的集合。

我們都知道數據庫很強大,但數據在其中的關係卻錯綜複雜,成千上萬個表通過各種關係或約 束互連以形成複雜的結構。沒有數據模型,利益相關者很難看到現有數據庫的結構、理解關鍵概念,當需要描述數據需求的時候,也很難準確地表達出來,這也是數據模型很重要的一個最主要的原因。

下圖是一個簡單數據模型的示例:

圖 2一個關於學生-出勤-課程的數據模型

(圖片來源:數據建模經典教程,Steve Hoberman)

二、數據模型的幾個關鍵形容詞

1. 數據模型是一組符號集合

與實物模型不同,數據模型不是等比例模擬出來的真實事物,而是一組能表示數據需求、數據結構的符號集合。

在房屋平面圖中,中間有條線的矩形表示窗戶,用直角扇形表示門。在數據模型中,用矩形框或圓角矩形表示實體;用線以及線上的符號表示實體之間的關係、基數或約束;用寫在線上的詞或詞組表示標籤,所有的這些符號組成了各種各樣的數據模型。

2. 數據模型是用來描繪、溝通數據需求的

建築設計師在蓋房之前通過房屋平面圖描繪建築需求,建築工人就可以看著這些平面圖來蓋房子。房子蓋完之後還可以把房屋平面圖展示給客戶,這樣即使客戶不去現場看實體房就可以大概瞭解房屋結構。數據模型也是專門設計出來描繪數據需求,給技術實現人員來建造數據庫,並且實現數據需求無障礙溝通的“圖紙”。

3. 數據模型是簡單易懂、標準的

模型之所以可以讓人們實現快速溝通,是因為足夠標準並且簡單易懂。

自古以來,無論是蓋房子還是造火箭,都不可能事先把龐大複雜的實物拿過來給大家介紹,相反只需要通過一些簡單標準的符號,就可以表示清楚具體的意思。一旦讀者看到標準的模型語言,他們能馬上能開始討論這個模型是否準確,而不需要浪費任何額外的時間去探討建模用的符號是什麼意思。

4. 數據模型是便於計算機實現的

數據模型從一個抽象層次描述了數據的靜態特徵、動態行為和約束條件,最終是要通過技術實現人員轉化成能被計算機理解的程序語言,並且在數據庫中實現出來的。所以在設計數據模型的時候,必須將便於計算機實現作為模型設計的原則之一。

三、為什麼需要數據模型?

企業中經常會出現以下問題:

1. 不同技術背景和業務經驗的各類人員在討論數據需求時缺少一種有效的溝通工具,在討論中經常因為對各種符號理解不一致,導致溝通效率低下,不同觀點之間很難協調,達成共識。

2. 當系統出現故障或發現數據問題時,沒有可以觀察系統的整體視角,技術人員對當前數據庫內的狀況全然不知,導致系統問題排查困難,數據問題無從下手。

3. 不同部門對業務規則的理解不一致,關於“客戶”、“產品”等關鍵概念含義多種多樣,數據庫中同名不同義,同義不同名現象隨處可見,極大地影響了數據的識別和應用。

4. ……

數據模型作為不同技術背景和業務經驗的各類人員有效溝通數據需求的重要媒介,可以幫助描述與溝通數據需求、增加數據的精確性與易用性、降低系統的維護成本並增加數據可重用性,極大地減少了以上問題出現的頻率。

1. 數據模型可以幫助不同人員描述與溝通數據需求

在企業中,來自不同部門、具有不同技術背景的業務人員、業務分析師、數據分析師、建模人員、架構師、數據庫設計人員、開發人員等各類人員經常需要共同討論數據問題與數據需求。數據模型作為一種理想的溝通工具,可以快速使相關人員達成共識,跳過對符號的理解而直接討論深層需求。

2. 數據模型可以增加數據的精確性與易用性

數據模型中的精確定義為數據提供了一個規範的結構,數據建模過程本身是發現、分析、界定數據需求的過程,可以幫助解釋數據上下文的邊界,減少數據訪問和數據存儲時發生數據異常的可能性。通過說明數據中的結構和關係,數據模型使數據更易於使用。

3. 數據模型可以降低系統維護成本、提升資產可重用性

數據模型有助於我們從整體視角瞭解業務與數據現狀,並有助於人們分析目前可能存在的業務與數據問題、分析修改現有數據結構是否可行和每次修改可能會帶來的影響,降低維護成本。

另外,數據模型以相對標準精確的形式保留了關於企業系統或項目的記憶,這些記憶可以作為可重用性資產供未來項目使用,從而降低構建新應用程序的成本。

三、總結

作為不同技術背景與業務經驗的各類人員有效溝通數據需求的重要媒介,數據模型越來越成為數字化轉型的核心能力。數據模型有助於人們描述與溝通數據需求、增加數據的精確性與易用性、降低系統的維護成本並增加可重用性。

參考

[1] DAMA International.DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition)[M].Technics Publications:BASKING RIDGE, NEW JERSEY,2017:123.

[2] Steve Hoberman.Data Modeling Made Simple: A Practical Guide for Business and IT Professionals[M].Technics Publications:BASKING RIDGE, NEW JERSEY,2009

題圖來自Unsplash,基於CC0協議


分享到:


相關文章: