如何实现大规模知识图谱的构建、推理及应用?

产业智能官

一 Konwledge Graph概念

Konwledge Graph是谷歌于2012年提出的用于增强其搜索引擎功能的知识库。本质上来说,知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。现在的知识图谱已被用来泛指各种大规模的知识库。

具体表现:在谷歌中搜索北京景点,能够得到结构化的知识,而不是简单的网页结果。

知识图谱是一种结构化的语义知识库,其基本组成单位是“实体-关系-实体”的三元组,以及实体及其相关属性-值对,通过实体间的关系构成网状的知识结构,如:

上图构成一个特定领域(明星)的知识网络,每一个节点(如:谢霆锋)均为实体,实体具有属性-值(key-value)对(如:明星名字:谢霆锋),同时实体与实体之间通过关系(如:王菲-旧爱-谢霆锋)相互连接。

也就是说:

实体-对应现实世界的语义本体;

属性-描述一类实体的common特性,实体被属性所标注;

关系-对应本体间的关系,连接了不同类型的实体。


二 Konwledge Graph架构

从逻辑架构上分,可将Konwledge Graph分为两层:数据层与模式层。

数据层主要由一系列的事实组成,而知识将以事实为单位进行存储,如:实体-关系-实体,实体-属性-值这样的三元组,对应到实际的数据;模式层则建立在数据层之上,主要是通过本体库来规范数据层的一系列事实表达,对应到实际的数据规范,术语描述等。

从体系架构上分,可将Konwledge Graph分为两种模式,自顶向下与自底向上。

1)自顶向下

自顶向下,首先定义好本体,确定领域的层次结构及各个概念属性及概念与概念间的关系,之后再将实体加入到知识库中,类似一种填充的模式,代表工作是Freebase,从维基百科中提取结构化数据。


2)自底向上

自底向上指的是从开放的数据源中,抽取实体、属性及关系,往上构建概念,最终形成本体。目前,这个模式被大多数工作采用,代表工作有谷歌的Knowledge Vault。

下面是一般自底向上构建本体库的流程:


三 Konwledge Graph应用

1)优化搜索


2)金融领域的智能投顾、反欺诈等

3)社交领域中的兴趣推荐、用户聚类等


分享到:


相關文章: