AWS Neptune圖形資料庫重磅發布,關係型資料庫Out了嗎?

近日,公有云巨頭AWS宣佈在中國區將全面推出一款運行速度快、可靠度高且完全可控的圖形數據庫服務--Neptune。

那麼問題來了,何為圖形數據庫?AWS重磅推出Neptune意義何在?

AWS Neptune圖形數據庫重磅發佈,關係型數據庫Out了嗎?

為什麼要用圖形數據庫?

數據本身並不產生任何價值,只有對數據進行有效分析,從中提取出洞見,數據的價值才能被釋放出來。在過去的幾十年裡,關係型數據庫佔據了數據存儲數據管理的主流。關係型數據庫把數據用2維表格的形式存儲,當處理數據間的關係時,需要對不同的表格進行關聯。在數據量小時,這種處理方式相當高效,但在互聯網時代,數據量動輒上TB。此時如果我們要對海量數據創建、提取複雜關係,那系統成本越來越高,性能卻越來越差。

關係型數據庫並不適用於處理海量數據間複雜的關係。這時,圖形數據庫就出來給大家解決這一難題了,它可以幫助我們在數據之間創建關係並快速查詢這些關係。

圖形數據庫是一種非關係型數據庫,它應用圖形理論中的頂點(node)、定向聯接(edge)和屬性(property)來存儲實體之間的關係信息。具體來說,

  • 頂點是指圖形中的實體,比如人、公司、帳戶
  • 定向聯接是指頂點間的鏈接,每個定向聯接都從一點頂點指向別一個頂點,表明了這2個頂點間的關係。當把從多定向聯接放在一起看時,頂點間的關係就就清晰可見了。
  • 屬性是對頂點的描述,例如,如果維基百科是一個頂點的話,那麼它的屬性可能是『網站』或『參考資料』,這取決於維基百科在不同數據庫中代表的不同含義。

例如在下圖的例子中,Anna、Justin、Alana都是頂點,它是的屬性是人;Books Movies則是別一類屬性的節點。節點間的單向箭頭表明了頂點間複雜的關係。

AWS Neptune圖形數據庫重磅發佈,關係型數據庫Out了嗎?

示意圖:圖形概念

應用場景:

1.社交推薦

基於社交關係的推薦是現在比較流行的一種方式。例如在電商購物場景中,利用圖形數據庫,開發者可以在圖形中存儲客戶興趣、好友和購買歷史記錄等信息之間的關係,當用戶登錄電商平臺搜索商品時,推薦系統可以通過後臺的圖形數據庫快速查詢關係,以此對用戶進行精準的物品推薦。如果使用傳統的關係型數據庫,是很難如此迅速地利用關係進行精準推薦的。

AWS Neptune圖形數據庫重磅發佈,關係型數據庫Out了嗎?

圖:社交推薦

2.欺詐檢測

通過圖形數據庫,可以快速地檢測交易方的關係模式,比如從而檢測潛在購買者是否在使用與已知欺詐案例相同的電子郵件地址和信用卡,是否多個人與個人電子郵件地址相關聯,或者多個人共享同一個 IP 地址但居住在不同的物理地址,從而快速地檢測出潛在的欺詐交易。

AWS Neptune圖形數據庫重磅發佈,關係型數據庫Out了嗎?

圖:通過關係進行快速欺詐檢測

目前有哪些值得關注的圖形數據庫?

1.Neo4j

Neo4j是一個流行的圖形數據庫, 它的優勢表現在以下兩個方面。 Neo4j是一個原生圖計算引擎,它存儲和使用的數據自始至終都是使用原生的圖結構數據進行處理的,不像有些圖數據庫,只是在計算處理時使用了圖結構數據,而在存儲時還將數據保存在關係型數據庫中。Neo4j是一個開源的數據庫,其開源的社區版吸引了眾多第三方的使用和推廣,如開源項目Spring Data Neo4j就是一個做得很不錯的例子,同時也得到了更多開發者的擁躉和支持,聚集了豐富的可供交流和學習的資源與案例。這些支持、推廣和大量的使用,反過來會很好地推動Neo4j的發展。也支持其他編程語言,如Ruby和Python。

AWS Neptune圖形數據庫重磅發佈,關係型數據庫Out了嗎?

neo4j

2.FlockDB

FlockDB是Twitter為進行關係數據分析而構建的, Twitter用它來存儲人與人之間的關係圖。FlockDB的特點在於其簡潔性,數據模型不需要對圖形進行遍歷。

3.AllegroGraph

AllegroGraph是一個基於W3c標準的為資源描述框架構建的圖形數據庫。AllegroGraph以三元組的形式存儲數據和元數據,通過結合磁盤存儲及高效內存利用,可以在處理數十億規模的三元組數據 時仍保持高效的性能。

結語:

隨著5G、傳感器、雲平臺等信息技術的發展,數字化正在顛覆著各行各業,隨之而來的是指數型的數據爆發。是否能夠快速從快速增長的海量數據中獲取洞察,以數據驅動創新,成了未來商業競爭的關鍵。圖形數據庫處理關係的優勢,在未來會有更大的用武之地。

AWS Neptune圖形數據庫重磅發佈,關係型數據庫Out了嗎?



分享到:


相關文章: