当当读书
首页
书房
账户
购物车
分享
分享到
QQ空间
新浪微博
关闭
Spark高级数据分析(第2版)
(美)桑迪·里扎(Sandy Ryza), (美)于里·莱瑟森(Uri Laserson), (英)肖恩·欧文(Sean Owen), (美)乔希·威尔斯(Josh Wills)
0
¥
28.99
抢
秒
原价¥28
¥
开通租阅权,免费读此书
提示:数字商品不支持退换货,不提供源文件,不支持导出打印。
评论
赠一得一
收藏
分享
此书籍暂不支持在移动端购买和阅读
秒
剩余
0
天
00
小时
00
分
00
秒
抢
此商品限时抢购中,剩余
1
天
12
小时
31
分
23
秒
减
折
满80元折上8折
N件折
满2件折上8折
N元场
已选1件,再选1件即可享8折
领券
查看对应纸书
25.2
详情
目录
评论(
0
)
内容简介
本书是使用Spark行大规模数据分析的实战宝典,由知名数据科学家撰写。本书在第1版的基础上,针对Spark近年来的发展,对样例代码和所使用的资料行了大量更新。新版Spark使用了全新的核心API,MLlib和Spark SQL两个子项目也发生了较大变化,本书为关注Spark发展趋势的读者提供了与时俱的资料,例如Dataset和DataFrame的使用,以及与DataFrame API高度集成的Spark ML API。
【推荐语】
作为计算框架,Spark速度快,发简单,能同时兼顾批处理和实时数据分析,因此很快被广大企业级用户所采纳,并随着近年人工智能的崛起而成为分析和挖掘大数据的重要得力工具。 本书由业内知名数据科学家执笔,通过丰富的示例展示了如何结合Spark、统计方法和真实世界数据集来解决数据分析问题,既涉及模型的构建和评价,也涵盖数据清洗、数据预处理和数据探索,并描述了如何将结果变为生产应用,是运用Apache Spark行大数据分析和处理的实战宝典。 第2版根据新版Spark杰出实践,对样例代码和所用资料做了大量更新。 本书涵盖模式如下: ● 音乐推荐和Audioscrobbler数据集 ● 用决策树算法预测森林植被 ● 基于K均值聚类行网络流量异常检测 ● 基于潜在语义算法分析维基百科 ● 用GraphX分析伴生网络 ● 对纽约出租车轨迹行空间和时间数据分析 ● 通过蒙特卡罗模拟来评估金融风险 ● 基因数据分析和BDG项目 ● 用PySpark和Thunder分析神经图像数据
【作者】
【作者简介】 桑迪·里扎(Sandy Ryza),Spark项目代码提交者、Hadoop项目管理委员会委员,Time Series for Spark项目创始人。曾任Cloudera公司高级数据科学家,现就职于Remix公司从事公共交通算法发。 于里·莱瑟森(Uri Laserson),MIT博士毕业,致力于用技术解决遗传学问题,曾利用Hadoop生态系统发了可扩展的基因组学和免疫学技术。目前是西奈山伊坎医学院遗传学助理教授,曾任Cloudera公司核心数据科学家。 肖恩·欧文(Sean Owen),Spark、Mahout项目代码提交者,Spark项目管理委员会委员。现任Cloudera公司数据科学总监。 乔希·威尔斯(Josh Wills),Crunch项目发起人,现任Slack公司数据工程主管。曾任Cloudera公司高级数据科学总监。 【译者简介】 龚少成 现任万达科技集团数据工程部总经理,清华大学自动化系研究生毕业,国内专注企业级大数据平台建设的先驱者之一,曾经在Intel和Cloudera公司担任大数据技术负责人,Cloudera公司认证大数据培训讲师。 邱鑫 毕业于武汉大学,目前就职于英特尔亚太研发有限公司,是Intel大数据团队高级工程师。主要研究大数据与深度学习技术,是基于Spark的深度学习框架BigDL的核心贡献者。
展开
作者
(美)桑迪·里扎(Sandy Ryza), (美)于里·莱瑟森(Uri Laserson), (英)肖恩·欧文(Sean Owen), (美)乔希·威尔斯(Josh Wills)
出版
人民邮电出版社
分类
出版物 >
计算机/网络 >
程序设计
大家都在看
换一批
C++新经典
王健伟
HTML5从入门到精通(第3版)
明日科技
Flask Web开发实战:入门、进阶与原理解析
李辉
Python网络爬虫:从入门到精通(附微课)
吕云翔 主编
算法详解(卷3)——贪心算法和动态规划
蒂姆·拉夫加登(Tim Roughgarden) 著
Python数据科学实战
尤利•瓦西列夫(Yuli Vasiliev) 著
面向对象是怎样工作的(第3版)
[日]平泽章 著
Python办公效率手册
麦叔 著
Python 3.8从零开始学
刘艳,刘宇宙
大家都在看
换一批
HBase权威指南(“十二五”国家重点图书出版规划项目)
[美]Lars George 著
PHP 7+MySQL 8动态网站开发从入门到精通(视频教学版)
张工厂
PHP核心技术与*佳实践(第2版)
列旭松;陈文
Go程序员面试笔试宝典
猿媛之家
HTML5权威指南
(美)Adam Freeman 著
零基础PHP学习笔记
明日科技
C专家编程
[美] 彼得·范德林登(Peter Van Der Linden)
Python网络爬虫:从入门到精通(附微课)
吕云翔 主编
算法详解(卷3)——贪心算法和动态规划
蒂姆·拉夫加登(Tim Roughgarden) 著
购物车
购买
免费试读
加入购物车
领取优惠券
温馨提示:
您已领取的礼券,请到【个人中心】-【资产】中查看。
升级VIP,6万精品免费读。
快来当当读书app
取消
确定