当当云阅读 > 科技 > 计算机/网络 > 计算机理论与教程 > Spark快速大数据分析

Spark快速大数据分析电子书

Spark发者出品！《Spark快速大数据分析》是一本为Spark初学者准备的书，它没有过多深实现细节，而是更多关注上层用户的具体用法。不过，本书绝不仅仅限于Spark的用法，它对Spark的核心概念和基本原理也有较为全面的介绍，让读者能够知其然且知其所以然。本书介绍了源集群计算系统Apache Spark，它可以加速数据分析的实现和运行。利用Spark，你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。

售价：¥

纸质售价：¥40.70购买纸书

1331人正在读 | 1人评论

作者：[美] 卡劳（Holden Karau）[美] 肯维尼斯科（Andy Konwinski）[美] 温德尔（Patrick Wendell）[加] 扎哈里亚（Matei Zaharia）

出版社：人民邮电出版社

出版时间：2015-09-01

字数：23.9万

所属分类：科技 > 计算机/网络 > 计算机理论与教程

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(1条)

读书简介
目录
累计评论(1条)

本书由 Spark 发者及核心成员共同造，讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark，它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法，学会交互、迭代和增量式分析，解决分区、数据本地化和自定义序列化等问题。 【推荐语】 Spark发者出品！《Spark快速大数据分析》是一本为Spark初学者准备的书，它没有过多深实现细节，而是更多关注上层用户的具体用法。不过，本书绝不仅仅限于Spark的用法，它对Spark的核心概念和基本原理也有较为全面的介绍，让读者能够知其然且知其所以然。本书介绍了源集群计算系统Apache Spark，它可以加速数据分析的实现和运行。利用Spark，你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。本书由Spark发者编写，可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业，还能了解从简单的批处理作业到流处理以及机器学习等应用。 【作者】 Holden Karau是Databricks的软件发工程师，活跃于源社区。她还著有《Spark快速数据处理》。 Andy Konwinski是Databricks联合创始人，Apache Spark项目技术专家，还是Apache Mesos项目的联合发起人。 Patrick Wendell是Databricks联合创始人，也是Apache Spark项目技术专家。他还负责维护Spark核心引擎的几个子系统。 Matei Zaharia是Databricks的CTO，同时也是Apache Spark项目发起人以及Apache基金会副主席。

目录展开