当当读书
首页
书房
账户
购物车
分享
分享到
QQ空间
新浪微博
关闭
Spark机器学习
彭特里思(Nick Pentreath)
0
¥
28.50
抢
秒
原价¥28
¥
开通租阅权,免费读此书
提示:数字商品不支持退换货,不提供源文件,不支持导出打印。
评论
赠一得一
收藏
分享
此书籍暂不支持在移动端购买和阅读
秒
剩余
0
天
00
小时
00
分
00
秒
抢
此商品限时抢购中,剩余
1
天
12
小时
31
分
23
秒
减
折
满80元折上8折
N件折
满2件折上8折
N元场
已选1件,再选1件即可享8折
领券
查看对应纸书
25.2
详情
目录
评论(
0
)
内容简介
《Spark机器学习》每章都设计了案例研究,以机器学习算法为主线,结合实例探讨了Spark 的实际应用。书中没有让人抓狂的数据公式,而是从准备和正确认识数据始讲起,全面涵盖了推荐系统、回归、聚类、降维等经典的机器学习算法及其实际应用。
【推荐语】
Apache Spark是一个分布式计算框架,专为满足低延迟任务和内存数据存储的需求而优化。现有并行计算框架中,鲜有能兼顾速度、可扩展性、内存处理以及容错性,同时还能简化编程,提供灵活、表达力丰富的强大API的,Apache Spark就是这样一个难得的框架。 本书介绍了Spark的基础知识,从利用Spark API来载和处理数据,到将数据作为多种机器学习模型的输。此外还通过详细的例子和现实应用讲解了常见的机器学习模型,包括推荐系统、分类、回归、聚类和降维。另外还介绍了一些高阶内容,如大规模文本数据的处理,以及Spark Streaming下的在线机器学习和模型评估方法。 如果你是一名Scala、Java或Python发者,对机器学习和数据分析感兴趣,并想借助Spark框架来实现常见机器学习技术的大规模应用,那么本书便是为你而写。有Spark的基础知识,但并不要求你有实践经验。 通过学习本书,你将能够: 用Scala、Java或Python语言编写你的一个Spark程序; 在你的本机和Amazon EC2上创建和配置Spark发环境; 获取公的机器学习数据集,以及使用Spark对数据行载、处理、清理和转换; 借助Spark机器学习库,利用协同过滤、分类、回归、聚类和降维等常见的机器学习模型来编写程序; 编写Spark函数来评估你的机器学习模型的性能; 了解大规模文本数据的处理方法,包括特征提取和将文本数据作为机器学习模型的输; 探索在线学习方法,利用Spark Streaming来行在线学习和模型评估。
【作者】
Nick Pentreath是Graphflow公司联合创始人。Graphflow是一家大数据和机器学习公司,专注于以用户为中心的推荐系统和客户服务智能化技术。Nick拥有金融市场、机器学习和软件发背景,曾任职于高盛集团,之后去在线广告营销创业公司Cognitive Match Limited(伦敦)担任研究科学家,后又去非洲**的社交网络Mxit领导数据科学与分析团队。Nick是Apache Spark项目管理委员会成员之一。
展开
作者
彭特里思(Nick Pentreath)
出版
人民邮电出版社
分类
出版物 >
计算机/网络 >
计算机教材
大家都在看
换一批
Power BI数据处理与分析(微课版)
黄达明 张萍 编著
大数据通识教程(微课版)
杨武剑 史麒豪 主编
全国计算机等级考试上机考试题库 二级Python
策未来 编著
计算机网络基础(第5版)
段标,尹晓勇
统计思维:程序员数学之概率统计(第2版)
唐尼(Allen B. Downey)
Vue.js 前端开发 快速入门与专业应用
陈陆扬
分布式系统开发实战
柳伟卫 编著
全国计算机等级考试模拟考场 二级C语言
策未来 编著
计算机网络教程
谢钧 谢希仁 编著
大家都在看
换一批
Power BI数据处理与分析(微课版)
黄达明 张萍 编著
大数据通识教程(微课版)
杨武剑 史麒豪 主编
全国计算机等级考试上机考试题库 二级Python
策未来 编著
计算机网络基础(第5版)
段标,尹晓勇
统计思维:程序员数学之概率统计(第2版)
唐尼(Allen B. Downey)
Vue.js 前端开发 快速入门与专业应用
陈陆扬
分布式系统开发实战
柳伟卫 编著
全国计算机等级考试模拟考场 二级C语言
策未来 编著
计算机网络教程
谢钧 谢希仁 编著
购物车
购买
免费试读
加入购物车
领取优惠券
温馨提示:
您已领取的礼券,请到【个人中心】-【资产】中查看。
升级VIP,6万精品免费读。
快来当当读书app
取消
确定