數據倉庫相關組成部分

数据仓库的创始者Bill Inmon认为:数据仓库是为支持管理决策建立的,面向主题的,综合的,稳定的,随时间变化的数据集合。

  1. 面向主题的数据

在操作型系统中,每一个应用程序的数据根据应用程序的不同单独组织。数据仓库是根据各个主题来进行划分的。在数据仓库中,数据是跨应用程序的。

数据仓库相关组成部分

2.综合的数据

数据仓库相关组成部分

数据仓库抽取来自不同操作系统的数据。在将不同来源的数据存储到数据仓库中之前,你得先去除这些不一致性。将数据元素标准化,搞清楚每一个数据源中数据名称的含义。需要进行数据的清洗、转换。

标准化的项目:

命名规则

编码

数据特性

度量单位

3.数据的时间特性

操作型系统反映的是当前的信息。数据仓库中的数据是提供分析和决策使用的,除了包含当前数据之外,还必须包含历史数据。

数据仓库中的数据是和时间变化有关的数据:

可以对过去进行分析

与当前的信息相关

可以对未来进行预测

4.数据的非易变性

每一个商业交易行为并不直接更新数据仓库中的数据,而是实时的更新操作系统中的数据。每当交易发生的时候,在操作型系统中增加、改变或删除数据,而并不频繁的对数据进行更新。数据一旦进入数据仓库,就不能进行修改。

数据仓库相关组成部分

5.数据粒度

在数据仓库中,根据查询的需要,需要得到不同级别的细节情况。数据仓库中的数据粒度就是指这种细节的级别。细节级别越低,数据粒度越小。

数据仓库相关组成部分

数据仓库由软件和硬件组成,为了满足组织我需要,必须用一个特定的方法将这些部分安排好以获得最大的效益。

下图显示了一个典型的数据仓库的基本组成部分。左边是数据源部分,紧接着是数据准备部分。中间是数据存储部分,它管理数据仓库的全部数据。这个部分不仅存储和管理数据,而且还保存了元数据信息。图右边是信息传递的部分。

数据仓库相关组成部分


分享到:


相關文章: