产业智能官
一 Konwledge Graph概念
Konwledge Graph是谷歌于2012年提出的用于增强其搜索引擎功能的知识库。本质上来说,知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。现在的知识图谱已被用来泛指各种大规模的知识库。
具体表现:在谷歌中搜索北京景点,能够得到结构化的知识,而不是简单的网页结果。
知识图谱是一种结构化的语义知识库,其基本组成单位是“实体-关系-实体”的三元组,以及实体及其相关属性-值对,通过实体间的关系构成网状的知识结构,如:
上图构成一个特定领域(明星)的知识网络,每一个节点(如:谢霆锋)均为实体,实体具有属性-值(key-value)对(如:明星名字:谢霆锋),同时实体与实体之间通过关系(如:王菲-旧爱-谢霆锋)相互连接。
也就是说:
实体-对应现实世界的语义本体;
属性-描述一类实体的common特性,实体被属性所标注;
关系-对应本体间的关系,连接了不同类型的实体。
二 Konwledge Graph架构
从逻辑架构上分,可将Konwledge Graph分为两层:数据层与模式层。
数据层主要由一系列的事实组成,而知识将以事实为单位进行存储,如:实体-关系-实体,实体-属性-值这样的三元组,对应到实际的数据;模式层则建立在数据层之上,主要是通过本体库来规范数据层的一系列事实表达,对应到实际的数据规范,术语描述等。
从体系架构上分,可将Konwledge Graph分为两种模式,自顶向下与自底向上。
1)自顶向下
自顶向下,首先定义好本体,确定领域的层次结构及各个概念属性及概念与概念间的关系,之后再将实体加入到知识库中,类似一种填充的模式,代表工作是Freebase,从维基百科中提取结构化数据。
2)自底向上
自底向上指的是从开放的数据源中,抽取实体、属性及关系,往上构建概念,最终形成本体。目前,这个模式被大多数工作采用,代表工作有谷歌的Knowledge Vault。
下面是一般自底向上构建本体库的流程:
三 Konwledge Graph应用
1)优化搜索
2)金融领域的智能投顾、反欺诈等
3)社交领域中的兴趣推荐、用户聚类等