数据集成技术(一)--集成概述

随着移动互联网、云计算、物联网等信息技术的飞速发展,越来越多的数据被产生,整个社会正在加速进入了“大数据”时代。对于企业来说,数据已经成为企业的财富,也是一种重要的战略资源。但在一个企业中,不同类型的数据通常是分布在若干个独立的信息系统中。以运营商为例,用户的计费和账单信息由信息化或市场部门的经营分析系统生成和维护,而用户在网络中所产生的信令和上网行为记录则由网络运维部门的网络运维系统存储。由于种种历史和现实原因,这些独立的信息系统之间缺少统一的接口,且数据结构差异巨大,造成企业内部的数据融合困难,也无法充分挖掘数据所包含的经济和社会价值。

如何将这些相互关联的分布式异构数据源集成在一起,能够让上层用户无视不同系统的数据差异,透明的方式访问这些数据,就是数据集成所要解决的问题。下图给出了一个典型的商业智能(BI:Business Intelligence)系统架构。

数据集成技术(一)--集成概述

数据集成总体架构

可以看到数据集成包含了:ETL、主数据管理、数据质量监控、元数据管理、数据生命周期管理共五大功能模块。在这个专题中,我们将依次对这些功能模块进行详细介绍,本片公众号将重点介绍ETL的主要流程和技术架构。


分享到:


相關文章: