好書推薦|圖算法:Apache Spark & Neo4j實例》(附PDF下載)


好書推薦|圖算法:Apache Spark & Neo4j實例》(附PDF下載)

Neo4j是一個高性能的、NoSQL圖數據庫,它將結構化數據存儲在網絡(從數學角度叫做圖)上而不是表中,具有嵌入式的、基於磁盤的、具備完全的事務特性的Java持久化引擎。Neo4j具有原生的圖分析、存儲和處理功能,其中的圖算法揭示隱藏的模式並增強了機器學習預測。

—文末附本書pdf最新版下載地址—

本書內容

本書是一本實用指南,幫助有使用Apache Spark™或Neo4j經驗的開發人員和數據科學家使用圖算法。雖然其算法示例使用Spark和Neo4j平臺,但本書也將有助於理解更一般的圖概念,不管你選擇使用哪種圖技術。

本書前兩章介紹了圖分析、算法和理論。第三章簡要介紹了本書中使用的平臺,接著三章重點介紹經典的圖算法:尋路、中心性和社區檢測。最後,用兩章來總結這本書,一章用於一般性分析,另一章用於機器學習,從而展示圖算法是如何在工作流中使用的。

在每一類算法的開頭,都有一個參考表,幫助您快速跳轉到相關算法。對於每個算法:

·解釋算法的功能;

·示例代碼提供了在Spark、Neo4j或兩者中使用算法的具體方法。

本書目錄

1. 介紹

什麼是圖?

什麼是圖分析和算法?

圖處理、數據庫、查詢和算法

為什麼要關心圖算法?

圖分析用例

總結

2. 圖論與概念

術語

圖類型和結構

圖的特性

圖算法的類型

總結

3. 圖平臺與處理

圖平臺和處理的注意事項

代表性平臺

總結

4. 尋路和圖搜索算法

示例數據:傳輸圖

廣度優先搜索

深度優先搜索

最短路徑

所有對的最短路徑

單一來源最短路徑

最小生成樹

隨機行走

總結

5. 中心性算法

圖數據示例:社交圖

中心度

接近中心性

中介中心性

PageRank

總結

6. 社區檢測算法

圖數據示例:軟件依賴關係圖

三角計數與聚類係數

強連接組件

已連接組件

標籤傳播

Louvain模塊度

驗證社區

總結

7. 圖算法在實踐中的應用

用Neo4j分析Yelp數據

用Apache Spark分析航班數據

探索性分析

總結

8. 用圖算法增強機器學習

機器學習與上下文的重要性

連通特徵提取與選擇

圖與機器學習在實踐中的應用:鏈接預測

總結

A. 其他信息和資源

索引


後臺私信回覆關鍵字“gas0209”即可獲得本文書籍PDF版本。


—完—

關注微信公眾平臺“智慧坊”(微信號:intelliworkshop),獲取更多原創文章及優質內容。


分享到:


相關文章: