好书推荐|图算法:Apache Spark & Neo4j实例》(附PDF下载)


好书推荐|图算法:Apache Spark & Neo4j实例》(附PDF下载)

Neo4j是一个高性能的、NoSQL图数据库,它将结构化数据存储在网络(从数学角度叫做图)上而不是表中,具有嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎。Neo4j具有原生的图分析、存储和处理功能,其中的图算法揭示隐藏的模式并增强了机器学习预测。

—文末附本书pdf最新版下载地址—

本书内容

本书是一本实用指南,帮助有使用Apache Spark™或Neo4j经验的开发人员和数据科学家使用图算法。虽然其算法示例使用Spark和Neo4j平台,但本书也将有助于理解更一般的图概念,不管你选择使用哪种图技术。

本书前两章介绍了图分析、算法和理论。第三章简要介绍了本书中使用的平台,接着三章重点介绍经典的图算法:寻路、中心性和社区检测。最后,用两章来总结这本书,一章用于一般性分析,另一章用于机器学习,从而展示图算法是如何在工作流中使用的。

在每一类算法的开头,都有一个参考表,帮助您快速跳转到相关算法。对于每个算法:

·解释算法的功能;

·示例代码提供了在Spark、Neo4j或两者中使用算法的具体方法。

本书目录

1. 介绍

什么是图?

什么是图分析和算法?

图处理、数据库、查询和算法

为什么要关心图算法?

图分析用例

总结

2. 图论与概念

术语

图类型和结构

图的特性

图算法的类型

总结

3. 图平台与处理

图平台和处理的注意事项

代表性平台

总结

4. 寻路和图搜索算法

示例数据:传输图

广度优先搜索

深度优先搜索

最短路径

所有对的最短路径

单一来源最短路径

最小生成树

随机行走

总结

5. 中心性算法

图数据示例:社交图

中心度

接近中心性

中介中心性

PageRank

总结

6. 社区检测算法

图数据示例:软件依赖关系图

三角计数与聚类系数

强连接组件

已连接组件

标签传播

Louvain模块度

验证社区

总结

7. 图算法在实践中的应用

用Neo4j分析Yelp数据

用Apache Spark分析航班数据

探索性分析

总结

8. 用图算法增强机器学习

机器学习与上下文的重要性

连通特征提取与选择

图与机器学习在实践中的应用:链接预测

总结

A. 其他信息和资源

索引


后台私信回复关键字“gas0209”即可获得本文书籍PDF版本。


—完—

关注微信公众平台“智慧坊”(微信号:intelliworkshop),获取更多原创文章及优质内容。


分享到:


相關文章: