Neo4j是一個高性能的、NoSQL圖數據庫,它將結構化數據存儲在網絡(從數學角度叫做圖)上而不是表中,具有嵌入式的、基於磁盤的、具備完全的事務特性的Java持久化引擎。Neo4j具有原生的圖分析、存儲和處理功能,其中的圖算法揭示隱藏的模式並增強了機器學習預測。
—文末附本書pdf最新版下載地址—
本書內容
本書是一本實用指南,幫助有使用Apache Spark™或Neo4j經驗的開發人員和數據科學家使用圖算法。雖然其算法示例使用Spark和Neo4j平臺,但本書也將有助於理解更一般的圖概念,不管你選擇使用哪種圖技術。
本書前兩章介紹了圖分析、算法和理論。第三章簡要介紹了本書中使用的平臺,接著三章重點介紹經典的圖算法:尋路、中心性和社區檢測。最後,用兩章來總結這本書,一章用於一般性分析,另一章用於機器學習,從而展示圖算法是如何在工作流中使用的。
在每一類算法的開頭,都有一個參考表,幫助您快速跳轉到相關算法。對於每個算法:
·解釋算法的功能;
·示例代碼提供了在Spark、Neo4j或兩者中使用算法的具體方法。
本書目錄
1. 介紹
什麼是圖?
什麼是圖分析和算法?
圖處理、數據庫、查詢和算法
為什麼要關心圖算法?
圖分析用例
總結
2. 圖論與概念
術語
圖類型和結構
圖的特性
圖算法的類型
總結
3. 圖平臺與處理
圖平臺和處理的注意事項
代表性平臺
總結
4. 尋路和圖搜索算法
示例數據:傳輸圖
廣度優先搜索
深度優先搜索
最短路徑
所有對的最短路徑
單一來源最短路徑
最小生成樹
隨機行走
總結
5. 中心性算法
圖數據示例:社交圖
中心度
接近中心性
中介中心性
PageRank
總結
6. 社區檢測算法
圖數據示例:軟件依賴關係圖
三角計數與聚類係數
強連接組件
已連接組件
標籤傳播
Louvain模塊度
驗證社區
總結
7. 圖算法在實踐中的應用
用Neo4j分析Yelp數據
用Apache Spark分析航班數據
探索性分析
總結
8. 用圖算法增強機器學習
機器學習與上下文的重要性
連通特徵提取與選擇
圖與機器學習在實踐中的應用:鏈接預測
總結
A. 其他信息和資源
索引
後臺私信回覆關鍵字“gas0209”,即可獲得本文書籍PDF版本。
—完—
關注微信公眾平臺“智慧坊”(微信號:intelliworkshop),獲取更多原創文章及優質內容。
閱讀更多 智慧坊 的文章