万本电子书0元读

万本电子书0元读

顶部广告

数据分析之图算法:基于Spark和Neo4j电子书

1.图算法为构建智能应用程序提供了快速建模的框架,有助于更准确、更快速地做出预测; 2.本书作者是Neo4j公司发者关系工程师,Neo4j认证专家,在图分析领域深耕多年; 3.本书基于Spark和Neo4j讲解路径查找算法、中心性算法、社团发现算法等近20种常用的图算法; 4.书中实例丰富,商品推荐和欺诈检测在内的许多人工智能问题能转换为图论问题。 莎士比亚曾说,世界是一个大舞台。在今天看来,世界是一张大图!将人物和事件视作节,将节之间的关系连成线,我们就能将错综复杂的关系网络转化为图,通过图分析洞悉复杂问题的本质。图算法已经广泛应用于数据分析领域,营销归因分析、欺诈网络检测、客户旅程建模、安全事故原因分析,甚至连莎士比亚戏剧的剧情分析,都会用到图算法。

售       价:¥

纸质售价:¥62.40购买纸书

187人正在读 | 1人评论 6.2

作       者:(英)马克·尼达姆(Mark Needham) (美) 埃米·E. 霍德勒(Amy E. Hodler)

出  版  社:人民邮电出版社有限公司

出版时间:2020-09-01

字       数:15.7万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
图分析可以揭示复杂系统和大规模网络的运作机制,图算法为构建智能应用程序提供了快速建模的框架,有助于更准确、更快速地做出预测。包括商品推荐和欺诈检测在内的许多人工智能问题能转换为图论问题。本书基于Spark和Neo4j讲解近20种常用的图算法,帮助读者拓展重要图分析类型的相关知识和能力,更快速地发现数据中的模式并找到更优的解决方案。<br/>【推荐语】<br/>1.图算法为构建智能应用程序提供了快速建模的框架,有助于更准确、更快速地做出预测; 2.本书作者是Neo4j公司发者关系工程师,Neo4j认证专家,在图分析领域深耕多年; 3.本书基于Spark和Neo4j讲解路径查找算法、中心性算法、社团发现算法等近20种常用的图算法; 4.书中实例丰富,商品推荐和欺诈检测在内的许多人工智能问题能转换为图论问题。 莎士比亚曾说,世界是一个大舞台。在今天看来,世界是一张大图!将人物和事件视作节,将节之间的关系连成线,我们就能将错综复杂的关系网络转化为图,通过图分析洞悉复杂问题的本质。图算法已经广泛应用于数据分析领域,营销归因分析、欺诈网络检测、客户旅程建模、安全事故原因分析,甚至连莎士比亚戏剧的剧情分析,都会用到图算法。 学习图算法有助于利用数据间的关系研究智能解决方案,并构建增强机器学习模型。本书作者来自Neo4j公司,在图分析领域深耕多年。你将跟随他们领略美妙的图算法世界,并利用流行平台Spark和Neo4j实现常用的图算法。 - 了解如何利用图分析揭示数据的预测性特征 - 了解如何实现近20种流行的图算法 - 了解各种图算法的适用场景 - 跟随示例在Spark和Neo4j中应用图算法 - 结合Spark和Neo4j创建机器学习工作流程<br/>【作者】<br/>马克·尼达姆(Mark Needham) Neo4j公司发者关系工程师,Neo4j认证专家,曾深度参与Neo4j因果集群的发工作。马克致力于帮助客户运用图数据库,善于针对富有挑战性的数据问题构建综合的解决方案。 埃米·E. 霍德勒(Amy E. Hodler) Neo4j公司图分析与人工智能项目总监,热爱网络科学,在图分析项目的发和运营方面有着丰富的经验,曾成功带领团队为EDS、微软、惠普等公司创造新的商机。<br/>
目录展开

版权声明

O'Reilly Media, Inc.介绍

业界评论

前言

本书内容

排版约定

使用示例代码

O'Reilly 在线学习平台(O'Reilly Online Learning)

联系我们

致谢

电子书

第 1 章 导论

1.1 何谓图

1.2 何谓图分析和图算法

1.3 图处理、图数据库、图查询和图算法

OLTP和OLAP

1.4 为何要关心图算法

1.5 图分析用例

1.6 小结

第 2 章 图论及其概念

2.1 术语

2.2 图的类型和结构

随机结构、小世界结构和无标度结构

2.3 图的种类

2.3.1 连通图与非连通图

2.3.2 无权图与加权图

2.3.3 无向图与有向图

2.3.4 无环图与有环图

2.3.5 稀疏图与稠密图

2.3.6 单部图、二部图和 k 部图

2.4 图算法的类型

2.4.1 路径查找

2.4.2 中心性

2.4.3 社团发现

2.5 小结

第 3 章 图平台和图处理

3.1 图平台和图处理的注意事项

3.1.1 平台注意事项

3.1.2 处理注意事项

3.2 典型平台

3.2.1 选择平台

3.2.2 Apache Spark

3.2.3 Neo4j 图平台

3.3 小结

第 4 章 路径查找算法和图搜索算法

4.1 示例数据:交通图

4.1.1 将数据导入Spark

4.1.2 将数据导入Neo4j

4.2 广度优先搜索

使用Spark实现广度优先搜索

4.3 深度优先搜索

4.4 最短路径算法

4.4.1 何时使用最短路径算法

4.4.2 使用 Neo4j 实现最短路径算法

4.4.3 使用Neo4j实现加权最短路径算法

4.4.4 使用Spark实现加权最短路径算法

4.4.5 最短路径算法的变体:A*算法

4.4.6 最短路径算法的变体:Yen 的 k 最短路径算法

4.5 所有点对最短路径算法

4.5.1 近观所有点对最短路径算法

4.5.2 何时使用所有点对最短路径算法

4.5.3 使用 Spark实现所有点对最短路径算法

4.5.4 使用Neo4j实现所有点对最短路径算法

4.6 单源最短路径算法

4.6.1 何时使用单源最短路径算法

4.6.2 使用Spark实现单源最短路径算法

4.6.3 使用Neo4j实现单源最短路径算法

4.7 最小生成树算法

4.7.1 何时使用最小生成树算法

4.7.2 使用Neo4j实现最小生成树算法

4.8 随机游走算法

4.8.1 何时使用随机游走算法

4.8.2 使用Neo4j实现随机游走算法

4.9 小结

第 5 章 中心性算法

5.1 示例数据:社交图

5.1.1 将数据导入Spark

5.1.2 将数据导入Neo4j

5.2 度中心性算法

5.2.1 可达性

5.2.2 何时使用度中心性算法

5.2.3 使用Spark实现度中心性算法

5.3 接近中心性算法

5.3.1 何时使用接近中心性算法

5.3.2 使用Spark实现接近中心性算法

5.3.3 使用Neo4j实现接近中心性算法

5.3.4 接近中心性算法变体:Wasserman & Faust算法

5.3.5 接近中心性算法变体:调和中心性算法

5.4 中间中心性算法

5.4.1 桥与控制点

5.4.2 计算中间中心性得分

5.4.3 何时使用中间中心性算法

5.4.4 使用Neo4j实现中间中心性算法

5.4.5 中间中心性算法变体:RA-Brandes算法

5.5 PageRank算法

5.5.1 影响力

5.5.2 PageRank算法公式

5.5.3 迭代、随机冲浪者和等级沉没

5.5.4 何时使用PageRank算法

5.5.5 使用Spark实现PageRank算法

5.5.6 使用Neo4j实现PageRank算法

5.5.7 PageRank算法变体:个性化PageRank算法

5.6 小结

第 6 章 社团发现算法

6.1 示例数据:软件依赖图

6.1.1 将数据导入Spark

6.1.2 将数据导入Neo4j

6.2 三角形计数和聚类系数

6.2.1 局部聚类系数

6.2.2 全局聚类系数

6.2.3 何时使用三角形计数和聚类系数

6.2.4 使用Spark实现三角形计数算法

6.2.5 使用Neo4j实现三角形计数算法

6.2.6 使用Neo4j计算局部聚类系数

6.3 强连通分量算法

6.3.1 何时使用强连通分量算法

6.3.2 使用Spark实现强连通分量算法

6.3.3 使用Neo4j实现强连通分量算法

6.4 连通分量算法

6.4.1 何时使用连通分量算法

6.4.2 使用Spark实现连通分量算法

6.4.3 使用Neo4j实现连通分量算法

6.5 标签传播算法

6.5.1 半监督学习和种子标签

6.5.2 何时使用标签传播算法

6.5.3 使用Spark实现标签传播算法

6.5.4 使用Neo4j实现标签传播算法

6.6 Louvain模块度算法

6.6.1 通过模块度进行基于质量的分组

6.6.2 何时使用Louvain模块度算法

6.6.3 使用Neo4j实现Louvain模块度算法

6.7 验证社团

6.8 小结

第 7 章 图算法实战

7.1 使用Neo4j分析Yelp数据

7.1.1 Yelp社交网络

7.1.2 导入数据

7.1.3 图模型

7.1.4 Yelp数据概览

7.1.5 行程规划应用程序

7.1.6 旅游商务咨询

7.1.7 查找相似类别

7.2 使用Spark分析航班数据

7.2.1 探索性分析

7.2.2 热门机场

7.2.3 源自ORD的延误

7.2.4 SFO的糟糕一天

7.2.5 通过航空公司互连的机场

7.3 小结

第 8 章 使用图算法增强机器学习

8.1 机器学习和上下文的重要性

图、上下文和准确率

8.2 关联特征提取与特征选择

8.2.1 图特征

8.2.2 图算法特征

8.3 图与机器学习实践:链接预测

8.3.1 工具和数据

8.3.2 将数据导入Neo4j

8.3.3 合著者关系图

8.3.4 创建均衡的训练数据集和测试数据集

8.3.5 如何预测缺失链接

8.3.6 创建机器学习管道

8.3.7 预测链接:基本图特征

8.3.8 预测链接:三角形和聚类系数

8.3.9 预测链接:社团发现

8.4 小结

8.5 总结

附录 额外信息及资料

其他算法

Neo4j批量数据导入和Yelp

APOC和其他Neo4j工具

查找数据集

Spark和Neo4j平台帮助信息

培训资源

关于作者

关于封面

看完了

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部