当当云阅读 > 科技 > 计算机/网络 > 软件系统 > Spark机器学习(第2版)

Spark机器学习(第2版)电子书

Apache Spark是分布式计算框架，专为满足低延迟任务和内存数据存储的需求而优化。现有的并行计算框架，鲜有能在兼顾速度、可扩展性、内存处理和容错性的同时，还提供灵活、表达力丰富的API的。Apache Spark就是这样一个难得的框架。本书简要介绍了Spark基础知识，重在通过详细的例子和现实应用来讲解常见机器学习模型，并涉及大规模文本数据的处理、Spark Streaming下的在线机器学习和模型评估方法，以及使用Spark ML Pipeline API创建和调试机器学习流程等。第2版经过全面修订，新增有关机器学习数学基础以及Spark ML Pipeline API的章节，内容更加系统、全面、与时俱，适合所有欲借助Spark来实现常见机器学习应用的发者。

售价：¥

纸质售价：¥49.50购买纸书

180人正在读 | 0人评论

6.2

作者：（印）拉结帝普·杜瓦（Rajdeep Dua）,（印）曼普利特辛格·古特拉（Manpreet Singh Ghotra）,（南非）尼克·彭特里思（Nick Pentreath）

出版社：人民邮电出版社

出版时间：2018-11-01

字数：37.3万

所属分类：科技 > 计算机/网络 > 软件系统

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(0条)

读书简介
目录
累计评论(0条)

本书结合案例研究讲解Spark 在机器学习中的应用，并介绍如何从各种公渠道获取用于机器学习系统的数据。内容涵盖推荐系统、回归、聚类、降维等经典机器学习算法及其实际应用。第2版新增了有关机器学习数学基础以及Spark ML Pipeline API 的章节，内容更加系统、全面、与时俱。 【推荐语】 Apache Spark是分布式计算框架，专为满足低延迟任务和内存数据存储的需求而优化。现有的并行计算框架，鲜有能在兼顾速度、可扩展性、内存处理和容错性的同时，还提供灵活、表达力丰富的API的。Apache Spark就是这样一个难得的框架。本书简要介绍了Spark基础知识，重在通过详细的例子和现实应用来讲解常见机器学习模型，并涉及大规模文本数据的处理、Spark Streaming下的在线机器学习和模型评估方法，以及使用Spark ML Pipeline API创建和调试机器学习流程等。第2版经过全面修订，新增有关机器学习数学基础以及Spark ML Pipeline API的章节，内容更加系统、全面、与时俱，适合所有欲借助Spark来实现常见机器学习应用的发者。 ·Spark以及机器学习基础知识介绍。 ·获取公的机器学习数据集，使用Spark对数据行载、处理、清理和转换。 ·借助Spark机器学习库，利用协同过滤、分类、回归、聚类和降维等常见的机器学习模型来编写程序。 ·了解大规模文本数据的处理方法，包括特征提取和将文本数据作为机器学习模型的输。 ·探索在线学习方法，利用Spark Streaming行在线学习和模型评估。 ·使用Spark ML Pipeline API创建和调试机器学习流程。 【作者】 拉结帝普·杜瓦（Rajdeep Dua） Salesforce公司工程主管，致力于造云计算和人工智能团队。曾参与Google的大数据分析工具BigQuery的宣传团队。在云计算、大数据分析和机器学习领域有近20年的经验。曼普利特·辛格·古特拉（Manpreet Singh Ghotra） Salesforce公司软件工程主管，拥有十余年软件发经验，目前致力于发基于Apache Spark的机器学习平台。尼克·彭特里思（Nick Pentreath） IBM源数据及人工智能技术中心首席工程师，大数据及机器学习公司Graphflow联合创始人，Spark项目管理委员会成员。【译者简介】蔡立宇曾从事自然语言处理和图数据分析相关工作，现提供数据分析相关的独立咨询和发服务。坐标深圳。

目录展开