AWS Neptune图形数据库重磅发布,关系型数据库Out了吗?

近日,公有云巨头AWS宣布在中国区将全面推出一款运行速度快、可靠度高且完全可控的图形数据库服务--Neptune。

那么问题来了,何为图形数据库?AWS重磅推出Neptune意义何在?

AWS Neptune图形数据库重磅发布,关系型数据库Out了吗?

为什么要用图形数据库?

数据本身并不产生任何价值,只有对数据进行有效分析,从中提取出洞见,数据的价值才能被释放出来。在过去的几十年里,关系型数据库占据了数据存储数据管理的主流。关系型数据库把数据用2维表格的形式存储,当处理数据间的关系时,需要对不同的表格进行关联。在数据量小时,这种处理方式相当高效,但在互联网时代,数据量动辄上TB。此时如果我们要对海量数据创建、提取复杂关系,那系统成本越来越高,性能却越来越差。

关系型数据库并不适用于处理海量数据间复杂的关系。这时,图形数据库就出来给大家解决这一难题了,它可以帮助我们在数据之间创建关系并快速查询这些关系。

图形数据库是一种非关系型数据库,它应用图形理论中的顶点(node)、定向联接(edge)和属性(property)来存储实体之间的关系信息。具体来说,

  • 顶点是指图形中的实体,比如人、公司、帐户
  • 定向联接是指顶点间的链接,每个定向联接都从一点顶点指向别一个顶点,表明了这2个顶点间的关系。当把从多定向联接放在一起看时,顶点间的关系就就清晰可见了。
  • 属性是对顶点的描述,例如,如果维基百科是一个顶点的话,那么它的属性可能是『网站』或『参考资料』,这取决于维基百科在不同数据库中代表的不同含义。

例如在下图的例子中,Anna、Justin、Alana都是顶点,它是的属性是人;Books Movies则是别一类属性的节点。节点间的单向箭头表明了顶点间复杂的关系。

AWS Neptune图形数据库重磅发布,关系型数据库Out了吗?

示意图:图形概念

应用场景:

1.社交推荐

基于社交关系的推荐是现在比较流行的一种方式。例如在电商购物场景中,利用图形数据库,开发者可以在图形中存储客户兴趣、好友和购买历史记录等信息之间的关系,当用户登录电商平台搜索商品时,推荐系统可以通过后台的图形数据库快速查询关系,以此对用户进行精准的物品推荐。如果使用传统的关系型数据库,是很难如此迅速地利用关系进行精准推荐的。

AWS Neptune图形数据库重磅发布,关系型数据库Out了吗?

图:社交推荐

2.欺诈检测

通过图形数据库,可以快速地检测交易方的关系模式,比如从而检测潜在购买者是否在使用与已知欺诈案例相同的电子邮件地址和信用卡,是否多个人与个人电子邮件地址相关联,或者多个人共享同一个 IP 地址但居住在不同的物理地址,从而快速地检测出潜在的欺诈交易。

AWS Neptune图形数据库重磅发布,关系型数据库Out了吗?

图:通过关系进行快速欺诈检测

目前有哪些值得关注的图形数据库?

1.Neo4j

Neo4j是一个流行的图形数据库, 它的优势表现在以下两个方面。 Neo4j是一个原生图计算引擎,它存储和使用的数据自始至终都是使用原生的图结构数据进行处理的,不像有些图数据库,只是在计算处理时使用了图结构数据,而在存储时还将数据保存在关系型数据库中。Neo4j是一个开源的数据库,其开源的社区版吸引了众多第三方的使用和推广,如开源项目Spring Data Neo4j就是一个做得很不错的例子,同时也得到了更多开发者的拥趸和支持,聚集了丰富的可供交流和学习的资源与案例。这些支持、推广和大量的使用,反过来会很好地推动Neo4j的发展。也支持其他编程语言,如Ruby和Python。

AWS Neptune图形数据库重磅发布,关系型数据库Out了吗?

neo4j

2.FlockDB

FlockDB是Twitter为进行关系数据分析而构建的, Twitter用它来存储人与人之间的关系图。FlockDB的特点在于其简洁性,数据模型不需要对图形进行遍历。

3.AllegroGraph

AllegroGraph是一个基于W3c标准的为资源描述框架构建的图形数据库。AllegroGraph以三元组的形式存储数据和元数据,通过结合磁盘存储及高效内存利用,可以在处理数十亿规模的三元组数据 时仍保持高效的性能。

结语:

随着5G、传感器、云平台等信息技术的发展,数字化正在颠覆着各行各业,随之而来的是指数型的数据爆发。是否能够快速从快速增长的海量数据中获取洞察,以数据驱动创新,成了未来商业竞争的关键。图形数据库处理关系的优势,在未来会有更大的用武之地。

AWS Neptune图形数据库重磅发布,关系型数据库Out了吗?



分享到:


相關文章: